什么是 LongCat Image 文本到图像 ComfyUI 工作流程?
LongCat Image 文本到图像是一个紧凑的 ComfyUI 工作流程,用于从文本提示生成方形 1024x1024 图像。它使用 LongCat-Image 扩散模型结合 Qwen 2.5 VL 文本编码器和 AE VAE,为肖像、产品拍摄和精美编辑风格的视觉效果提供了一个简单的提示到图像设置。
图形设计简洁:选择方形分辨率,编写提示,运行工作流程并保存图像。无论是英文还是中文提示,它都非常适合快速迭代,附带的说明建议如果您想与原始模型设置进行比较,可以尝试 50 步。
LongCat Image 文本到图像的关键特性
- 优先方形生成: 默认设置调校为 1:1 输出,分辨率为 1024x1024。
- 紧凑的工作流程设计: 图形专注于提示到图像生成,没有额外的路由复杂性。
- 灵活的提示: 适用于英文和中文文本提示。
- 易于质量调节: 从默认的 20 步设置开始,然后在需要更慢但更深思熟虑的采样时增加步骤。
如何在 ComfyUI 中使用 LongCat Image
- 选择输出尺寸
- 使用
Resolution Selector节点保持默认方形布局,或根据需要调整目标像素数。
- 使用
- 编写您的提示
- 打开
Text to Image (LongCat Image)子图,并用您自己的主题、光线、氛围和构图说明替换默认提示。
- 打开
- 运行工作流程
- 队列化图形以从您的提示生成单个图像。
- 保存结果
- 一旦运行完成,
Save Image节点将写入最终输出。
- 一旦运行完成,
提示和设置
- 当前默认设置在 20 步 和 CFG 4 下运行。
- 如果您想与源工作流程的原始建议进行比较,请尝试 50 步。
- 在此紧凑图形中,清晰具体的提示往往比宽泛或抽象的提示片段效果更好。


