Google Gemini 是什麼?Nano Banana Pro 怎麼用?2026 完整介紹

從 Gemini 3.1 Pro 到 Nano Banana Pro/Nano Banana 2,Google 整套 AI 模型一次看懂
設計師 Riven

設計師 Riven

2026年5月12日 下午 2:05

AI 設計

AI MODELS · 2026

Google Gemini 是什麼?Nano Banana Pro 怎麼用?2026 完整介紹封面,含 Gemini 模型家族與 Nano Banana Pro / Nano Banana 2 介紹卡

▲ 2026 / 5 版 Google AI 全景圖:Gemini 3.1 Pro、Nano Banana Pro、Nano Banana 2,與整個 Google 生態的整合

QUICK ANSWER

Gemini 是 Google 的旗艦 AI 模型家族(2026 / 5 現役主力是 Gemini 3.1 Pro),Nano Banana 是這個家族裡專門做圖像生成與編輯的子模型。原版 Nano Banana 在 2025 年 8 月推出爆紅,11 月升級成 Nano Banana Pro(Gemini 3 Pro Image),2026 年 2 月再推 Nano Banana 2(Gemini 3.1 Flash Image),結合 Pro 級品質與 Flash 級速度,已成 Gemini app 預設模型。

2026 年上半的 AI 戰場有件事很多人沒察覺:Google 把所有東西兜回 Gemini 這個底座之下。文字、推理、圖像、影片、搜尋——以前散落在 Bard、Imagen、PaLM 的能力,現在全部走同一條神經中樞。

你會發現一件有趣的事:當創作圈在討論「該換到 ChatGPT Image 2 還是 Midjourney V7」的時候,Google 不聲不響推出一個叫 Nano Banana 的圖像模型,在 LM Arena 衝到 #1,然後幾個月內把它升級成 Pro 版、又推出 Flash 速度版。半個科技圈還沒反應過來。

這篇把整個生態講清楚——Gemini 是什麼、Nano Banana 怎麼演進、設計師可以怎麼用、它跟 ChatGPT Image 2 / Midjourney 的真正差別在哪。

CONTENTS

01 | Gemini 與 Nano Banana 是什麼關係
02 | Gemini 模型家族拆解:3.1 Pro / 3 Pro / 3 Flash
03 | Nano Banana 三代演進:原版 → Pro → 2
04 | 設計師最有感的五大能力
05 | 哪裡能用、怎麼開始、價格方案
06 | Nano Banana vs ChatGPT Image 2 vs Midjourney
07 | 觀點收尾與常見問題

CHAPTER 01 · WHAT IS IT

Gemini 與 Nano Banana 是什麼關係

先把名詞理清楚——這兩個東西很多人混在一起講,但其實是「家族」與「成員」的關係。

Gemini 是 Google 在 2023 年底推出的多模態 AI 模型總家族,是 Bard 與 PaLM 的繼任者。它原生支援文字、程式、圖像、音訊、影片的同時處理,不是把不同模型黏一起。整個家族分成 Pro / Flash / Flash-Lite 三個等級,再依世代命名(2.5 → 3.0 → 3.1)。Google 旗下從 Gemini app、Search AI Mode、Workspace、Vertex AI 到 Android 系統,背後都跑這套。

Nano Banana 是 Gemini 家族裡專門負責圖像生成與編輯的分支。它不是獨立產品,是 Gemini 底層能力的一個「成像引擎」——你在 Gemini app 點「Create images」、在 Google Search 用 AI Mode 要圖、在 Google Ads 拉素材,背後就是這個模型在跑。

「Nano Banana」這個怪名字其實是社群幫它取的綽號。模型在 LM Arena 匿名測試時用了這個代號,創作圈喊得太順口,最後 Google 索性把它扶正成正式品牌。

"

Gemini 是腦,Nano Banana 是手。

— 同一套底層智能,分工負責不同感官輸出

GEMINI ECOSYSTEM

🧠

Gemini 3.1 Pro

文字推理旗艦
2M token 上下文

🍌

Nano Banana Pro

圖像生成編輯
4K 解析度

🎬

Veo 3.1

影片生成
原生音效同步

🎵

Lyria 3 Pro

音樂生成
多軌編曲

▲ Gemini 是底層,這些是它對外的不同感官接口

CHAPTER 02 · MODEL FAMILY

Gemini 3.x 模型家族拆解

2026 年 5 月的 Gemini 跑到 3.1 世代,主要分成三個等級——Pro 處理難題、Flash 平衡速度成本、Flash-Lite 跑量。每一級都有對應的圖像版本(XX Image)。

▲ Google DeepMind 官方:A new era of intelligence with Gemini 3,2025 年 11 月發布

三大主力模型

模型

定位

適用場景

Gemini 3.1 Pro

旗艦推理,
2M token 上下文

複雜推理、長文件分析、vibe coding、深度研究

Gemini 3 Flash

速度與成本最佳化

大量呼叫、客服 agent、即時對答、影片分析

Gemini 3.1 Flash-Lite

最便宜,
$0.25 / 1M token

高頻分類、過濾、初步處理、預算敏感應用

Gemini 3.1 Pro 的關鍵亮點

Gemini 3.1 Pro 在 2026 年 2 月正式上線,跟 3 Pro 比起來推理能力提升明顯。三個對設計師最有感的能力:

2M token 上下文。比 Claude Opus 4.7 的 200K 標準視窗大十倍,可以一次塞進整個 codebase、一小時的影片、一份完整的設計系統文件。我做設計系統審查的時候,這個視窗大小直接改變工作流——以前要切段餵,現在一次丟。

生成式 UI。3.1 Pro 可以直接吐出可執行的 HTML/CSS/JS,包含動態 SVG、互動 dashboard、3D 場景。Google 自己 demo 過用一句話生出可操作的 ISS 太空站軌跡視覺化,不是貼圖,是真的可以拖拉縮放的活組件。

回答更直接。Google 官方寫的話術是「trading cliché and flattery for genuine insight」——換成白話,就是少廢話、少恭維、有什麼說什麼。實際用下來確實,跟 GPT-5.2 那種會繞圈圈的個性差很多。

CHAPTER 03 · NANO BANANA

Nano Banana 三代演進史

從 2025 年 8 月初代問世到 2026 年 2 月推出 Flash 速度版,Google 在九個月內把這個圖像引擎迭代了三次。每一代都在解一個明確的問題。

Nano Banana Pro 官方主視覺拼貼,展示模型生成的多語言文字、立體場景、品牌包裝、迷你公仔等多元樣張

▲ Google DeepMind 為 Nano Banana Pro 發布的官方主視覺,集結模型不同類型的生成樣張(圖:Google DeepMind)

EVOLUTION TIMELINE

2025

08

Nano Banana 初代

Gemini 2.5 Flash Image

靠「修復老照片」「轉換迷你公仔」這類社群挑戰爆紅。第一次讓一般使用者覺得 AI 圖像編輯能用,不只是好玩。

2025

11

Nano Banana Pro

Gemini 3 Pro Image

升級到 Gemini 3 Pro 底座。多語言文字渲染、4K 解析度、infographic 生成、real-world knowledge 整合一次補齊。對設計師來說,這版才是真正能進工作流的版本。

2026

02

Nano Banana 2

Gemini 3.1 Flash Image

把 Pro 級品質壓到 Flash 級速度。已成 Gemini app 預設模型,連 Google Search 跟 Flow 影片工具也換成它。Image Search Grounding 是新亮點——生圖時會去 Google Search 抓真實參考圖。

Pro vs 2,怎麼選?

Pro 跟 2 不是繼承關係,是並存——一個追品質、一個追速度。

Pro 走 Thinking 模式,生圖前會「想」一下構圖、邏輯、文字位置,產出 native 2K 自動升 4K,適合海報、品牌視覺、infographic 這類需要精準與耐看的場景。

2 拿掉 Thinking 那一段、直接吐圖,速度十秒以內,但品質保留了 Pro 的多語言、文字渲染、世界知識。適合大量迭代、社群素材、快速 mockup。

CHAPTER 04 · WHAT IT DOES

設計師最有感的五大能力

AI 圖像模型滿街跑,但 Nano Banana 系列有五件事真的把競爭對手拋在後面。

▲ Google DeepMind 官方:Nano Banana Pro - Your new creative partner

01 — Infographic 生成

這是 Nano Banana Pro 跟其他模型最大的代差。它能直接從一張原始照片或一段文字描述,吐出帶完整資訊架構的圖表——標題、副標、分區、圖示、文字標註全部到位,而且每個元素的版面邏輯都對。

Nano Banana Pro 將植物照片轉成資訊圖表,包含葉片紋理、原生地、生長習性、養護重點

▲ 輸入一張「龜背芋」照片,輸出帶完整 infographic 架構的科普圖(圖:Google DeepMind)

關鍵在底層接到 Gemini 的 real-world knowledge 與 Google Search grounding。你給它一棵植物的照片,它知道這是 String of Turtles(龜背芋),會自動去抓原生地、學名、生長條件,再排版成圖。整個過程 ChatGPT Image 2 也做得到,但 Nano Banana Pro 的資訊密度與版面完整度明顯高一階。

02 — 多語言文字渲染

做品牌素材最痛的一件事:AI 生圖把英文渲染成亂碼。Nano Banana Pro 不只把英文做對,連韓文、日文、中文、阿拉伯文都能正確輸出,而且支援同一個 prompt 內多語言混排。

Nano Banana Pro 將英文飲料包裝原汁原味換成韓文,保持版面與字距

▲ 飲料罐包裝從英文「REFRESH & REVIVE」換成韓文「상쾌함 & 활력」,版面、字距、留白都保留(圖:Google DeepMind)

對在做跨國品牌或多語版本素材的設計師,這個能力直接省掉一個工序。以前要 Photoshop 慢慢換字、調 kerning,現在丟一句「把這款罐裝換成韓文版本」就出來了。

03 — 多素材合成(Multi-image fusion)

Nano Banana Pro 可以一次吃進最多 14 張參考圖,理解每張圖的角色定位(人物、服裝、家具、植物、海報),再合成一張統一場景。

Nano Banana Pro 多素材合成:六張獨立輸入素材合成單一時尚拍攝場景

▲ 六張獨立輸入素材(設計師、禮服、椅子、植物、海報)合成單一時尚拍攝場景(圖:Google DeepMind)

做產品攝影合成、虛擬實景、提案 mockup 的時候,這個能力的價值很直接——以前要找場、找模特、買道具,現在素材丟給它一張一張組起來就好。

04 — 角色一致性

Nano Banana 2 號稱可以維持 95% 的角色辨識度,跨多張圖換角度、換場景、換動作。對做 storyboard、漫畫分鏡、IG 系列貼文的人來說,這條解掉一個老問題:以前用 Midjourney 一張一張生,第二張就變另一個人。

05 — SynthID 與 C2PA 浮水印

每張 Nano Banana 生的圖都會嵌入 Google DeepMind 的 SynthID 隱形浮水印,2026 年 2 月再加上 C2PA Content Credentials。對做品牌、出版、商業案件的設計師,這個是合規層面的剛性需求——客戶問「這張圖怎麼產生的、能不能授權」,有可驗證的浮水印作答比較放心。

CHAPTER 05 · HOW TO USE

哪裡能用、怎麼開始、價格方案

使用入口

你不需要另開帳號、不用 API key、不裝外掛——Gemini 跟 Nano Banana 已經默默接進你日常用的 Google 產品裡。

Gemini app

主要入口。網頁 gemini.google.com、iOS、Android 都能用。選「Create images」「Thinking」就會切到 Nano Banana Pro

Google AI Studio

開發者入口。aistudio.google.com,有免費額度,可以測 API、寫應用

Google Slides

「Help me visualize」「Beautify this slide」直接內嵌 Nano Banana Pro

NotebookLM

把筆記轉成 infographic,這個應用場景跟 Obsidian 的二腦概念互補得很好

Search AI Mode

直接在搜尋結果裡生圖,已在美國 / Google AI Pro 訂戶上線

價格方案

Google 的訂閱結構在 2026 年重整過,現在分四階——免費、Plus、Pro、Ultra。對設計師而言 Pro 是甜蜜點。

FREE

$0

免費版

Gemini 2.5 Flash + 100 月度 AI credits,Nano Banana Pro 用完額度降到原版

PLUS

$7.99

入門訂閱

較多 Gemini 3 Pro 額度、Nano Banana Pro 額度、Veo 3.1 Lite 影片生成

PRO ★

$19.99

設計師甜蜜點

Gemini 3.1 Pro 完整存取、1M token 上下文、1000 AI credits、Deep Research

ULTRA

$249.99

最高配額

Veo 3.1 完整版、Deep Think、Gemini Agent、25,000 credits

▲ 月費以美元計。新訂戶 Pro 首年常有 50% 折扣。價格為 2026 / 5 時點,可能變動。

API 開發者價格

跑量比較大、要寫 app 接 API 的話:

模型

輸入

輸出

Gemini 3.1 Pro

$2 / 1M token

$12 / 1M token

Gemini 3 Flash

$0.50 / 1M token

$3 / 1M token

Nano Banana Pro (4K)

560 token / 圖

$0.24 / 4K 圖

▲ Cached input 可降到 10%,batch mode 50% off。長 context(200K+)會跳到 long context 費率。

CHAPTER 06 · COMPARED TO

vs ChatGPT Image 2 vs Midjourney

三大 AI 圖像生成主流,各有擅場。直接看對位。

能力

Nano Banana Pro

ChatGPT Image 2

Midjourney V7

Infographic 生成

★★★★★

★★★★☆

★★☆☆☆

多語言文字

★★★★★

★★★★☆

★★☆☆☆

美感 / 藝術性

★★★★☆

★★★★☆

★★★★★

寫實照片質感

★★★★☆

★★★★☆

★★★★★

多素材合成

★★★★★

★★★★☆

★★★☆☆

真實世界知識

★★★★★

★★★★☆

★★☆☆☆

官方浮水印

SynthID + C2PA

C2PA

什麼場景該用哪個

做品牌 mockup、海報、社群素材含中文 / 英文標語——選 Nano Banana Pro。文字渲染贏,infographic 邏輯贏。

做 moodboard、概念圖、藝術風格探索、寫實人像——選 Midjourney V7。美感天花板還是它最高,質感跟細節最油。

日常生圖、跟對話流程綁定、需要圖文混合輸出——選 ChatGPT Image 2。原本工作流就在 ChatGPT 的話,留在那邊最順。延伸閱讀可以看我整理的 ChatGPT Image 2 Prompt 大全

做影片或動態素材——配 Seedance 2.0 或 Google 自家的 Veo 3.1,先用 Nano Banana 出靜態 key visual 再丟進影片模型,是目前最順的工作流。

CHAPTER 07 · TAKEAWAYS

真正該帶走的觀點

把整個生態看完之後,有三件事值得記下來。

第一,Gemini 不再是「另一個聊天機器人」。它是 Google 把所有 AI 能力收回同一個底座的戰略動作。你在 Search、Gmail、Slides、Maps 用到的智能助手,全部都是 Gemini。這代表設計師接觸到 AI 的方式會越來越「無感」——不是打開另一個 app,而是工具本身會生圖、會解釋、會排版。

第二,Nano Banana Pro 是現在這個時間點,做 infographic 跟多語言文字渲染最強的圖像模型,沒有之一。如果你在做設計教育、品牌系統、跨國素材,這個工具一定要進到工作流。不是因為它最美,是因為它最聰明。

第三,工具更新速度遠超越能消化的速度。Gemini 從 3 Pro 到 3.1 Pro 只花了三個月。Nano Banana 從初代到第三代只花了九個月。這個更新節奏代表一件事:把時間花在追新工具,不如把時間花在建立可換工具的工作流。

Google 跟 Anthropic Claude、OpenAI 的戰場已經從「誰的模型最聰明」變成「誰能把模型放進最多人的日常」。Gemini 因為跟 Google 整個生態綁定,這場戰役有它先天的地利。

AI 覺醒設計應用攻略訂閱方案

SUBSCRIPTION · AIWAKEN

AI 覺醒設計應用攻略

AI 工具每週都在更新,我幫你過濾雜訊,只整理對設計師真正有用的應用。Nano Banana、Claude、Midjourney 一條工作流兜起來。

AI 工具實測與工作流

設計師角度 Prompt 技巧

每週 AI × 設計新知

了解訂閱方案 →

FAQ

常見問題

Q1:Gemini 跟 Nano Banana 是同一個東西嗎?

不是。Gemini 是 Google 整個 AI 模型家族的總稱,能做文字、推理、圖像、影片、音訊各種事。Nano Banana 是 Gemini 家族裡專門做圖像生成與編輯的子模型——你可以理解為「Gemini 的視覺輸出引擎」。

Q2:免費可以用 Nano Banana Pro 嗎?

可以,但有限額。免費用戶在 Gemini app 選 Thinking 模式可以試用 Nano Banana Pro,額度用完就會降回原版 Nano Banana。要無痛使用建議升級到 Google AI Pro($19.99 / 月)。

Q3:Nano Banana Pro 跟 Nano Banana 2 有什麼差別?

Pro 跑的是 Gemini 3 Pro Image,有 Thinking 推理階段,生圖慢但品質與邏輯最強,native 2K 升 4K。2 跑的是 Gemini 3.1 Flash Image,速度快十倍,品質保留 Pro 的多語言文字與世界知識能力,現在已成 Gemini app 預設模型。Pro 適合海報、品牌主視覺;2 適合大量生圖、迭代、社群素材。

Q4:商用授權有沒有限制?

Google 的服務條款允許生成內容商業使用。每張圖會帶 SynthID 隱形浮水印與 C2PA Content Credentials 做出處標記。實際商案前還是建議再讀一次最新版條款,並考量倫理層面(譬如生成跟真實品牌過度相似的視覺)。

Q5:Nano Banana 可以做中文字嗎?

可以,而且做得相當好。Pro 版的多語言文字渲染包含繁體中文、簡體中文、日文、韓文、阿拉伯文等。實測下來中文字形完整度高於 Midjourney V7、相當於 ChatGPT Image 2,但版面整體邏輯(標題、副標、圖文混排)Nano Banana Pro 領先。

Q6:API 開發要用哪個版本?

視場景而定。要做產品級高品質出圖、可以接受幾秒延遲——用 Gemini 3 Pro Image(Nano Banana Pro)。要做高頻、低延遲、量產素材——用 Gemini 3.1 Flash Image(Nano Banana 2)。可以同一個 prompt 兩個版本並行測,選結果好的那個入產品。

Q7:台灣可以正常使用嗎?

Gemini app 跟 Google AI Studio 在台灣都能正常使用,不需 VPN。Nano Banana Pro 在台灣可用,Search AI Mode 的 Nano Banana Pro 目前限美國等部分地區。Google AI Pro 訂閱方案台灣也能買,可以用台幣或信用卡付費。