什麼是 LongCat Image 文本到圖像 ComfyUI 工作流程?
LongCat Image 文本到圖像是一個緊湊的 ComfyUI 工作流程,用於從文本提示生成方形 1024x1024 圖像。它使用 LongCat-Image 擴散模型以及 Qwen 2.5 VL 文本編碼器和 AE VAE,為人像、產品拍攝和精美的編輯風格視覺效果提供簡單的提示到圖像設置。
圖表設計簡單明了:選擇方形分辨率,撰寫提示,運行工作流程並保存圖像。它在英語或中文提示中均能快速迭代,並且附帶的說明建議如果想與原始模型設置進行比較,可以嘗試 50 步。
LongCat Image 文本到圖像的主要特點
- 方形優先生成: 默認設置調整為 1:1 輸出,分辨率為 1024x1024。
- 緊湊的工作流程設計: 圖表專注於提示到圖像生成,無需額外的路由複雜性。
- 靈活的提示: 適用於英語和中文文本提示。
- 簡易質量調整: 從默認的 20 步設置開始,然後在需要更慢但更具深思熟慮的採樣時增加步數。
如何在 ComfyUI 中使用 LongCat Image
- 選擇輸出尺寸
- 使用
Resolution Selector節點保持默認方形佈局,或根據需要調整目標百萬像素。
- 使用
- 撰寫您的提示
- 打開
Text to Image (LongCat Image)子圖,並用自己的主題、光照、氛圍和構圖說明替換默認提示。
- 打開
- 運行工作流程
- 排隊圖表以從您的提示生成單個圖像。
- 保存結果
Save Image節點在運行完成後寫入最終輸出。
提示和設置
- 當前默認設置為 20 步,使用 CFG 4。
- 如果想與來源工作流程的原始建議進行比較,請嘗試 50 步。
- 在這個緊湊圖表中,清晰具體的提示通常比廣泛或抽象的提示片段效果更好。
