跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup
Qwen3.5 是一个开源多模态大语言模型,来自阿里巴巴云,在 Qwen 3.0 系列的基础上增加了图像理解能力。它同时支持文本生成和基于图像的任务,如图像描述和反向提示词工程。 模型亮点
  • 多模态 — 接受文本和图像输入,用于视觉理解任务
  • 图像描述 — 能够描述图像并生成详细说明
  • 反向提示词工程 — 从参考图像中提取提示词和生成参数
  • ComfyUI 原生支持 — 使用内置 TextGenerate 节点,无需自定义节点
  • 轻量级 — 4B 参数模型,适合消费级 GPU

使用场景

Qwen3.5 在需要将视觉理解与文本生成结合的 ComfyUI 场景中表现出色:
  • 图像反推提示词 — 将参考图像输入 Qwen3.5,让模型生成一份能够复现该图像的详细提示词。当你看到一张效果很好的图片但不知道它的 prompt 是怎样写的时,这个功能尤其有用。
  • 提示词优化 — 加载现有提示词和图像构思,让 Qwen3.5 生成、细化或扩展更丰富的描述以获得更好的生成效果。
  • 图像描述 — 自动为生成的图片生成标题、描述或元数据标签,适用于作品归档或训练数据准备。
  • 视觉问答 — 询问关于图像内容的问题(“这张图里有什么物体?”、“背景是什么颜色?”),获得结构化的文本答案。
  • 文字读取 — 使用合适的 prompt,模型可能会尝试读取图片中的可见文字或标签,但可靠性取决于文字渲染的质量和清晰度。

可用工作流

Qwen3.5: 文本生成

下载工作流

下载 JSON 或在模板库中搜索 “Qwen3.5 Text Generation”

在 Comfy Cloud 运行

在 Comfy Cloud 中打开
Qwen3.5 文本生成工作流 此工作流展示了 Qwen3.5 的文本生成和图像理解能力。接受文本提示词和可选图像输入,根据输入生成描述性文本或结构化分析。 输入
  • 文本提示词 — 你的问题、指令或任务描述
  • 图像(可选) — 用于视觉理解任务(图像描述、反向提示词工程、提示词优化等)
关键控制参数
  • 最大长度 — 生成的最大 token 数(默认 256)
  • 采样模式 — 开关采样,调节温度、top-k、top-p、重复惩罚和随机种子
  • 使用默认模板 — 应用模型内置系统提示词
输出
  • 生成的文本 — 模型回复的纯文本字符串

了解子图

本工作流使用子图节点进行模块化处理。查看子图文档了解如何自定义和扩展工作流。

模型下载

Qwen3.5 模型以文本编码器的形式加载到 ComfyUI 中。根据你的硬件选择合适的版本:

Qwen3.5 2B (bf16)

轻量版,约 4.5 GB。适合低显存环境和快速下载。

Qwen3.5 4B (bf16)

大小和质量均衡。推荐大多数消费级 GPU。

Qwen3.5 9B (bf16)

最大版本,约 19 GB。输出质量更高,需要更多显存。
将下载的 .safetensors 文件放入:
📂 ComfyUI/
├── 📂 models/
│   └── 📂 text_encoders/
│       └── qwen3.5_4b_bf16.safetensors   # 或 2b / 9b 版本