> ## Documentation Index
> Fetch the complete documentation index at: https://docs.comfy.org/llms.txt
> Use this file to discover all available pages before exploring further.

# Gemini Omni Flash：对话式视频生成

> 通过合作节点在 ComfyUI 中使用 Google 的多模态视频模型 Gemini Omni Flash，以自然语言生成和编辑视频

Gemini Omni Flash 是 Google DeepMind 推出的高质量、经济高效的视频生成与对话式编辑模型。该模型于 Google I/O 2026 作为 Gemini Omni 家族成员首次亮相，将 Gemini 的多模态推理能力与原生的视频创建功能结合，使开发者能够通过自然对话生成、编辑和重新混合视频。

<Tip>
  使用 API 节点需要保证你已经正常登录，并在受许可的网络环境下使用，请参考[API 节点总览](/zh/tutorials/partner-nodes/overview)部分文档来了解使用 API 节点的具体使用要求。
</Tip>

<Tip>
  <Tabs>
    <Tab title="便携版或手动安装用户">
      请确保你的 ComfyUI 已经更新。

      * [ComfyUI 下载](https://www.comfy.org/download)
      * [ComfyUI 更新教程](/zh/installation/update_comfyui)

      本指南里的工作流可以在 ComfyUI 的[工作流模板](/zh/interface/features/template)中找到。如果找不到，可能是 ComfyUI 没有更新。

      如果加载工作流时有节点缺失，可能原因有：

      1. 你用的不是最新开发版（nightly）。
      2. 你用的是稳定版或桌面版（没有包含最新的更新）。
      3. 启动时有些节点导入失败。
    </Tab>

    <Tab title="桌面版或云端用户">
      * 桌面版是基于 ComfyUI 稳定版本构建的，它会在有新的桌面稳定版本发布时自动更新。
      * [Cloud](https://cloud.comfy.org) 会在 ComfyUI 稳定版本发布后更新，我们会同步更新 Cloud。

      所以，如果你发现本教程中有任何核心节点缺失，那是因为对应的节点支持还在开发中没有发布正式的稳定版，请等待下一个稳定版本发布。
    </Tab>
  </Tabs>
</Tip>

## Gemini Omni Flash 提供的功能

* **对话式视频编辑**：使用自然语言精炼和编辑视频——替换角色、重新布光、改变角度、添加或移除物体，同时保留原始音视频轨道
* **多模态输入**：结合文本、图像和视频输入来引导生成。每次输出视频时原生生成同步音频
* **世界知识与模拟**：将物理理解与 Gemini 在历史、科学及文化背景方面的知识相结合，实现超越照片真实感的有意义叙事
* **文本与动作同步**：直接在视频中渲染清晰文本和图形，使动态排版与屏幕上的运动同步
* **定价**：每秒钟视频输出 \$0.10，与 Veo 3.1 Fast 定价一致

## 工作流

### 文本转视频

<CardGroup cols={2}>
  <Card title="在 Comfy Cloud 中运行" icon="cloud" href="https://cloud.comfy.org/?template=api_google_gemini_omni_flash_t2v&utm_source=docs&utm_medium=referral&utm_campaign=gemini_omni_flash">
    在 Comfy Cloud 中打开
  </Card>

  <Card title="下载工作流" icon="download" href="https://github.com/Comfy-Org/workflow_templates/blob/main/templates/api_google_gemini_omni_flash_t2v.json">
    下载 JSON，或在模板库中搜索“Gemini Omni Flash”
  </Card>
</CardGroup>

根据自然语言提示生成电影级视频。将文本描述转换为具有世界感知的运动、光照和声音的视频输出。非常适合社交媒体内容创作、快速视频原型制作以及迭代式视觉叙事。

### 图像转视频

<CardGroup cols={2}>
  <Card title="在 Comfy Cloud 中运行" icon="cloud" href="https://cloud.comfy.org/?template=api_google_gemini_omni_flash_i2v&utm_source=docs&utm_medium=referral&utm_campaign=gemini_omni_flash">
    在 Comfy Cloud 中打开
  </Card>

  <Card title="下载工作流" icon="download" href="https://github.com/Comfy-Org/workflow_templates/blob/main/templates/api_google_gemini_omni_flash_i2v.json">
    下载 JSON，或在模板库中搜索“Gemini Omni Flash”
  </Card>

  <Card title="下载示例图像 1" icon="image" href="https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/input/clay_toy_shop_old_man.png">
    获取此工作流的示例输入图像
  </Card>

  <Card title="下载示例图像 2" icon="image" href="https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/input/comic_toy_store_strips.png">
    获取第二张示例输入图像
  </Card>
</CardGroup>

使用 Gemini Omni Flash 从两张图像生成视频。解释自然语言提示以控制时长和画面比例。非常适合制作简短品牌剪辑、动态社交媒体内容，以及通过对话式提示进行迭代视频编辑。

### 视频编辑

<CardGroup cols={2}>
  <Card title="在 Comfy Cloud 中运行" icon="cloud" href="https://cloud.comfy.org/?template=api_google_gemini_omni_flash_video_edit&utm_source=docs&utm_medium=referral&utm_campaign=gemini_omni_flash">
    在 Comfy Cloud 中打开
  </Card>

  <Card title="下载工作流" icon="download" href="https://github.com/Comfy-Org/workflow_templates/blob/main/templates/api_google_gemini_omni_flash_video_edit.json">
    下载 JSON，或在模板库中搜索“Gemini Omni Flash”
  </Card>

  <Card title="下载示例视频" icon="video" href="https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/input/space_horse_rider.mp4">
    获取此工作流的示例输入视频
  </Card>
</CardGroup>

使用 Gemini Omni Flash 以自然语言编辑视频。根据描述性指令将单个输入视频转换为经过编辑的输出。在提示中指定时长和画面比例。非常适合快速社交媒体混剪、电影场景调整以及迭代视频精修。

## 开始使用

1. 将 ComfyUI 更新到最新版本
2. 双击画布，搜索“Gemini Omni Flash”节点
3. 或者进入模板库，使用现成的工作流
4. 选择与输入类型（文本、图像或视频）匹配的工作流
5. 输入提示并生成

<Note>
  为获得最佳效果，可将 Gemini Omni Flash 与 Nano Banana 2 Lite 组合使用：先高速生成图像，再用 Gemini Omni Flash 将它们动画化为视频。
</Note>
