Gemini Omni Flash 提供的功能
- 对话式视频编辑:使用自然语言精炼和编辑视频——替换角色、重新布光、改变角度、添加或移除物体,同时保留原始音视频轨道
- 多模态输入:结合文本、图像和视频输入来引导生成。每次输出视频时原生生成同步音频
- 世界知识与模拟:将物理理解与 Gemini 在历史、科学及文化背景方面的知识相结合,实现超越照片真实感的有意义叙事
- 文本与动作同步:直接在视频中渲染清晰文本和图形,使动态排版与屏幕上的运动同步
- 定价:每秒钟视频输出 $0.10,与 Veo 3.1 Fast 定价一致
工作流
文本转视频
在 Comfy Cloud 中运行
在 Comfy Cloud 中打开
下载工作流
下载 JSON,或在模板库中搜索“Gemini Omni Flash”
图像转视频
在 Comfy Cloud 中运行
在 Comfy Cloud 中打开
下载工作流
下载 JSON,或在模板库中搜索“Gemini Omni Flash”
下载示例图像 1
获取此工作流的示例输入图像
下载示例图像 2
获取第二张示例输入图像
视频编辑
在 Comfy Cloud 中运行
在 Comfy Cloud 中打开
下载工作流
下载 JSON,或在模板库中搜索“Gemini Omni Flash”
下载示例视频
获取此工作流的示例输入视频
开始使用
- 将 ComfyUI 更新到最新版本
- 双击画布,搜索“Gemini Omni Flash”节点
- 或者进入模板库,使用现成的工作流
- 选择与输入类型(文本、图像或视频)匹配的工作流
- 输入提示并生成
为获得最佳效果,可将 Gemini Omni Flash 与 Nano Banana 2 Lite 组合使用:先高速生成图像,再用 Gemini Omni Flash 将它们动画化为视频。