高速生成400萬像素照片,Ultra與Raw模式精準還原真實質感
Nano Banana 2 文字轉圖像:提示詞驅動的高速圖像生成(寬高比·安全控制)| RunComfy
使用 Nano Banana 2 從文字提示詞生成高品質圖像,提供寬高比、安全容忍度、輸出格式和可選提示詞增強的實用控制。
Nano Banana 2 簡介
Nano Banana 2 是一款專為快速迭代和精準提示詞追隨設計的高速模型。它能將簡短或詳細的提示詞轉化為高品質圖像,同時提供生產工作流中可依賴的實用控制——寬高比選擇、安全容忍度、輸出格式和可選的提示詞增強。
適用場景:快速概念探索 | 行銷創意草稿 | 社群媒體圖像和縮圖 | 批次變體生成
Nano Banana 2 範例










Nano Banana 2
Nano Banana 2(Gemini 3.1 Flash Image)是 Google DeepMind 的 Flash 級別圖像生成模型,專為高速視覺創作而設計,具備精確的指令追隨、出色的排版渲染和現實世界知識整合。
Nano Banana 2 文字轉圖像將單個文字提示詞轉化為 1–4 張圖像,支援透過種子控制進行可重現生成,以及 0.5K 到 4K 的靈活解析度層級。針對快速迭代、可預測的構圖和可用於生產的輸出進行了最佳化。
輸出格式:png、jpeg 或 webp。輸出:靜態圖像(批次大小:1–4)。
Nano Banana 2 亮點
- 極速生成:專為快速草稿→精修循環和低延遲而設計。
- 種子可重現:用固定種子鎖定視覺方向,或變更種子探索新變體。
- 靈活解析度層級:根據工作流階段選擇 0.5K / 1K / 2K / 4K。
- 智慧寬高比處理:用 "auto" 保留原始比例,或明確控制構圖。
- 出色的排版渲染:生成圖像內可讀文字和結構化佈局。
- 可選的網路搜尋增強:啟用網路搜尋以獲取最新參考資訊。
Nano Banana 2 參數
以下控制項可用於 Nano Banana 2 文字轉圖像。
| 參數 | 必填 | 類型 | 預設值 | 範圍 / 選項 | 說明 |
|---|---|---|---|---|---|
| prompt* | 是 (*) | string (str) | A cinematic close-up portrait... | — | 描述被寫體、場景、光照、風格和構圖的文字提示詞。 |
| num_images | 否 | integer | 1 | 1–4 | 每次請求生成的圖像數。 |
| seed | 否 | integer | 0 | 任意整數 | 控制隨機性。相同 seed = 類似結果。 |
| aspect_ratio | 否 | string | auto | auto, 21:9, 16:9, 3:2, 4:3, 5:4, 1:1, 4:5, 3:4, 2:3, 9:16 | 構圖。"auto" 保持自然構圖。 |
| resolution | 否 | string | 1K | 0.5K, 1K, 2K, 4K | 目標解析度。越高細節越豐富。 |
| output_format | 否 | string | png | jpeg, png, webp | 匯出格式。PNG 適合文字清晰度;JPEG/WEBP 適合縮小檔案。 |
| safety_tolerance | 否 | integer | 4 | 1–6 | 審核嚴格度。1 = 最嚴格;6 = 最寬鬆。 |
| limit_generations | 否 | boolean | true | true / false | 每輪提示詞限制為一次生成。 |
| enable_web_search | 否 | boolean | false | true / false | 允許整合最新網路資訊。 |
解析度與生成策略
- 0.5K–1K:適合快速草稿和佈局測試。
- 2K:社群媒體和行銷視覺的均衡之選。
- 4K:用於印刷或主橫幅的高精細生產輸出。
創意階段用低解析度×多種子嘗試,構圖確定後再提升解析度。
如何使用 Nano Banana 2
1) 編寫結構化提示詞:被寫體 → 動作 → 環境 → 風格 → 相機/光照。
2) 根據最終交付物設定 aspect_ratio(或保持 "auto")。
3) 根據草稿 vs. 正式生產選擇解析度。
4) 需要可重現結果時固定種子。
5) 生成 1–4 張圖像,檢查構圖、光照和排版。
6) 透過調整小變數(姿勢、顏色、氛圍)迭代,而非重寫整個提示詞。
提示詞最佳實踐
- 從主要被寫體和動作開始。
- 明確指定相機角度和光照。
- 排版指令要精確。
- 避免矛盾的風格指向。
- 精修概念時使用一致的種子。
官方資源
- Gemini API 圖像生成文件:https://ai.google.dev/gemini-api/docs/image-generation
- Build with Nano Banana 2:https://blog.google/innovation-and-ai/technology/developers-tools/build-with-nano-banana-2/
- Gemini 圖像生成概覽:https://gemini.google/overview/image-generation/
相關模型
六倍速生成高品質圖像,完美重現提示語,靈感轉化更高效
以 Dreamina 4.0 輕鬆完成高精度圖像轉圖像創作,呈現細膩且具風格的 4K 視覺效果,專為設計師而生。
以文字生成與編輯圖像,輕鬆打造品牌與故事的視覺設計
高真實感圖像、清晰文字與創意風格兼備的設計利器
以 GPT-4o Image 將圖片轉化為全新風格與構圖,輕鬆實現創意設計與精準視覺控制。
常見問題
Nano Banana 2 文字轉圖像最適合什麼場景?
Nano Banana 2 文字轉圖像專為快速迭代和穩定的提示詞追隨而設計,非常適合快速概念探索、行銷創意草稿、縮圖以及批次生成多種變體。
Nano Banana 2 文字轉圖像支援哪些寬高比?
Nano Banana 2 文字轉圖像支援常見的寬高比,包括 21:9、16:9、3:2、4:3、5:4、1:1、4:5、3:4、2:3 和 9:16。請選擇與目標版面(橫幅、方形貼文、限時動態等)相符的比例。
每次請求可以生成幾張圖像?
Nano Banana 2 文字轉圖像支援每次請求生成 1-4 張圖像。如需更多變化,可保留相同提示詞,使用不同的種子或稍作修改後重新生成。
safety_tolerance 是什麼,應該如何設定?
safety_tolerance 控制內容審核的嚴格程度。數值越低越嚴格,數值越高越寬鬆。對於品牌安全或面向大眾的內容,建議使用更嚴格的設定。
enhance_prompt 有什麼作用?
啟用後,enhance_prompt 會嘗試擴展或優化你的提示詞,以提高描述力和連貫性。如果你更偏好精確控制,請將其關閉,自己明確指定被寫體、風格、光照和構圖等約束。
有哪些輸出格式可用?
Nano Banana 2 文字轉圖像可以輸出 jpeg、png 或 webp 格式的圖像。png 適合清晰的圖形和文字,jpeg 適合較小的檔案,webp 則在品質和大小之間提供了良好的平衡。
RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。
