Nano Banana 2 文字轉圖像:提示詞驅動的高速圖像生成(寬高比·安全控制)| RunComfy

google/nano-banana-2/text-to-image

使用 Nano Banana 2 從文字提示詞生成高品質圖像,提供寬高比、安全容忍度、輸出格式和可選提示詞增強的實用控制。

用於圖像生成的提示詞。
要生成的圖像數量。
隨機數生成器的種子值。
生成圖像的寬高比。
生成圖像的解析度。
生成圖像的格式。
內容審核的安全容忍度等級。1 為最嚴格,6 為最寬鬆。
設為 true 時,每輪提示詞僅限一次生成。
啟用網路搜尋,以在生成時取得最新資訊。
Idle
The rate is $0.08 per image. 2K and 4K outputs will be charged at 1.5 times and 2 times the standard rate, respectively. 0.5K outputs will be charged at 0.75 times the standard rate. If web search is used, an additional $0.015 will be charged.

Nano Banana 2 簡介

Nano Banana 2 是一款專為快速迭代和精準提示詞追隨設計的高速模型。它能將簡短或詳細的提示詞轉化為高品質圖像,同時提供生產工作流中可依賴的實用控制——寬高比選擇、安全容忍度、輸出格式和可選的提示詞增強。

適用場景:快速概念探索 | 行銷創意草稿 | 社群媒體圖像和縮圖 | 批次變體生成

Nano Banana 2 範例

Nano Banana 2


Nano Banana 2(Gemini 3.1 Flash Image)是 Google DeepMind 的 Flash 級別圖像生成模型,專為高速視覺創作而設計,具備精確的指令追隨、出色的排版渲染和現實世界知識整合。


Nano Banana 2 文字轉圖像將單個文字提示詞轉化為 1–4 張圖像,支援透過種子控制進行可重現生成,以及 0.5K 到 4K 的靈活解析度層級。針對快速迭代、可預測的構圖和可用於生產的輸出進行了最佳化。


輸出格式:png、jpeg 或 webp。輸出:靜態圖像(批次大小:1–4)。


Nano Banana 2 亮點

  • 極速生成:專為快速草稿→精修循環和低延遲而設計。
  • 種子可重現:用固定種子鎖定視覺方向,或變更種子探索新變體。
  • 靈活解析度層級:根據工作流階段選擇 0.5K / 1K / 2K / 4K。
  • 智慧寬高比處理:用 "auto" 保留原始比例,或明確控制構圖。
  • 出色的排版渲染:生成圖像內可讀文字和結構化佈局。
  • 可選的網路搜尋增強:啟用網路搜尋以獲取最新參考資訊。

Nano Banana 2 參數

以下控制項可用於 Nano Banana 2 文字轉圖像。


參數必填類型預設值範圍 / 選項說明
prompt*是 (*)string (str)A cinematic close-up portrait...描述被寫體、場景、光照、風格和構圖的文字提示詞。
num_imagesinteger11–4每次請求生成的圖像數。
seedinteger0任意整數控制隨機性。相同 seed = 類似結果。
aspect_ratiostringautoauto, 21:9, 16:9, 3:2, 4:3, 5:4, 1:1, 4:5, 3:4, 2:3, 9:16構圖。"auto" 保持自然構圖。
resolutionstring1K0.5K, 1K, 2K, 4K目標解析度。越高細節越豐富。
output_formatstringpngjpeg, png, webp匯出格式。PNG 適合文字清晰度;JPEG/WEBP 適合縮小檔案。
safety_toleranceinteger41–6審核嚴格度。1 = 最嚴格;6 = 最寬鬆。
limit_generationsbooleantruetrue / false每輪提示詞限制為一次生成。
enable_web_searchbooleanfalsetrue / false允許整合最新網路資訊。

解析度與生成策略

  • 0.5K–1K:適合快速草稿和佈局測試。
  • 2K:社群媒體和行銷視覺的均衡之選。
  • 4K:用於印刷或主橫幅的高精細生產輸出。

創意階段用低解析度×多種子嘗試,構圖確定後再提升解析度。


如何使用 Nano Banana 2

1) 編寫結構化提示詞:被寫體 → 動作 → 環境 → 風格 → 相機/光照。

2) 根據最終交付物設定 aspect_ratio(或保持 "auto")。

3) 根據草稿 vs. 正式生產選擇解析度。

4) 需要可重現結果時固定種子。

5) 生成 1–4 張圖像,檢查構圖、光照和排版。

6) 透過調整小變數(姿勢、顏色、氛圍)迭代,而非重寫整個提示詞。


提示詞最佳實踐

  • 從主要被寫體和動作開始。
  • 明確指定相機角度和光照。
  • 排版指令要精確。
  • 避免矛盾的風格指向。
  • 精修概念時使用一致的種子。

官方資源

  • Gemini API 圖像生成文件:https://ai.google.dev/gemini-api/docs/image-generation
  • Build with Nano Banana 2:https://blog.google/innovation-and-ai/technology/developers-tools/build-with-nano-banana-2/
  • Gemini 圖像生成概覽:https://gemini.google/overview/image-generation/

相關模型

常見問題

Nano Banana 2 文字轉圖像最適合什麼場景?

Nano Banana 2 文字轉圖像專為快速迭代和穩定的提示詞追隨而設計,非常適合快速概念探索、行銷創意草稿、縮圖以及批次生成多種變體。

Nano Banana 2 文字轉圖像支援哪些寬高比?

Nano Banana 2 文字轉圖像支援常見的寬高比,包括 21:9、16:9、3:2、4:3、5:4、1:1、4:5、3:4、2:3 和 9:16。請選擇與目標版面(橫幅、方形貼文、限時動態等)相符的比例。

每次請求可以生成幾張圖像?

Nano Banana 2 文字轉圖像支援每次請求生成 1-4 張圖像。如需更多變化,可保留相同提示詞,使用不同的種子或稍作修改後重新生成。

safety_tolerance 是什麼,應該如何設定?

safety_tolerance 控制內容審核的嚴格程度。數值越低越嚴格,數值越高越寬鬆。對於品牌安全或面向大眾的內容,建議使用更嚴格的設定。

enhance_prompt 有什麼作用?

啟用後,enhance_prompt 會嘗試擴展或優化你的提示詞,以提高描述力和連貫性。如果你更偏好精確控制,請將其關閉,自己明確指定被寫體、風格、光照和構圖等約束。

有哪些輸出格式可用?

Nano Banana 2 文字轉圖像可以輸出 jpeg、png 或 webp 格式的圖像。png 適合清晰的圖形和文字,jpeg 適合較小的檔案,webp 則在品質和大小之間提供了良好的平衡。

RunComfy
版權 2026 RunComfy. 保留所有權利。

RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。