Gemini 3.5 Flash 是什麼?Google 把前線打到 Flash,這對設計師意味著什麼
AI MODELS · 2026/05
QUICK ANSWER
Gemini 3.5 Flash 是 Google 在 I/O 2026 發布的最新模型,agentic 與 coding benchmark 跑贏自家 3.1 Pro,輸出速度是其他前線模型的 4 倍,價格不到一半。Pro 版本延到六月推出。這次最值得看的不是參數,是 Google 把 Pro 級智慧塞進 Flash 級價格的策略——讓 9 億 Gemini app 用戶直接在預設模型上跑 agent,agent 從付費功能變成水電瓦斯。
IN THIS STORY
01 · I/O 2026 到底發了什麼
02 · 跑分背後真正的劇本
03 · Google 把前線打到 Flash 的賭注
04 · 設計師可以怎麼用
05 · 跟 Claude / GPT 怎麼分工
06 · 在哪可以開始用
07 · 3.5 Pro 來了會怎樣
08 · 一句話收尾
FAQ · 常見問題
CHAPTER 01 · WHAT HAPPENED
I/O 2026 到底發了什麼
時間是 5/19 早上,Pichai 在 Shoreline Amphitheatre 開場。前半小時都在熱身,講 AI 規模、TPU、SynthID。真正的核心在他喊出「Gemini 3.5」的那一刻——但接著他停了一下,補了一句:「3.5 Pro 還沒好,給我們幾週時間。」
現場據說有人唉了一聲。但接下來發生的事,比起一個延期,遠遠更值得留意——Google 把整個 keynote 的力氣,全押在 3.5 Flash 上。
這場發表會一次推了四件事,全部圍著 agent:
MODEL
Gemini 3.5 Flash
立即 GA。Gemini app、AI Mode、API、Antigravity 都吃得到。Pro 延到下個月。
VIDEO MODEL
Gemini Omni
用對話編輯影片。免費版進 YouTube Shorts,付費進 Gemini app 與 Flow。
PERSONAL AGENT
Gemini Spark
24/7 個人 agent,跑在 3.5 Flash 上。Trusted tester 先開,AI Ultra 訂戶下週進 beta。
DEV PLATFORM
Antigravity
Gemini CLI 收編進 Antigravity;agent-first 的 IDE 與 CLI 雙形態並行。
這四個都不是孤立的產品。它們是一條鏈:Antigravity 是工作環境,3.5 Flash 是引擎,Spark 是個人 agent 的長期版本,Omni 是多模態輸出端。Google 想說的不是「我們又出了一個模型」,是「我們把 agent 從一個 feature 升級成基礎設施」。
▲ Google 官方 I/O 2026 Recap,5 分鐘看完整場發表會。影片/Google
CHAPTER 02 · BY THE NUMBERS
跑分背後真正的劇本
Google 給的頭條數字很響亮:Terminal-Bench 2.1 76.2%、MCP Atlas 83.6%、CharXiv Reasoning 84.2%、輸出速度比其他前線模型快 4 倍。這些數字單看都漂亮,但放回完整對照表會看到另一個故事。
仔細讀這張表會發現:3.5 Flash 並沒有全面碾壓所有對手。它領先的維度集中在兩條線——agentic 工作與多模態理解。其他維度,前線仍然在別人手裡。
3.5 Flash 真正贏的地方
MCP Atlas(83.6%)是多步工具使用,agent 連串呼叫 tool 完成任務的能力。這條線 3.5 Flash 把 Opus 4.7(79.1%)和 GPT-5.5(75.3%)都壓在後面。CharXiv Reasoning(84.2%)是從複雜圖表中提煉資訊的能力,多模態的硬功夫。MMMU-Pro(83.6%)同樣是多模態理解,3.5 Flash 也是最高。
這三個維度對設計師工作流剛好命中——你的素材是圖、你的工作是 agent 在多步驟之間穿梭。
3.5 Flash 還沒贏的地方
SWE-Bench Pro(55.1%)純 coding bug fix,Opus 4.7(64.3%)仍然領先。Long context MRCR v2 128k(77.3%),GPT-5.5(94.8%)是另一個世界。Humanity's Last Exam(40.2%)純學術推理,Opus 4.7(46.9%)勝。ARC-AGI-2(72.1%)抽象推理,GPT-5.5(84.6%)大幅領先。
所以這個故事不是「Flash 變全能」。是 Google 把 3.5 Flash 訓練成一個「agent-first」的模型——多步驟、多工具、多模態理解,這三條合起來就是 agent 在真實世界跑長時間任務需要的肌肉群。其他能力沒被砍,但也沒被優先優化。
Google 沒有把 3.5 Flash 訓練成一個全才。它訓練的是一個 agent。
CHAPTER 03 · THE BET
Google 把前線打到 Flash 的賭注
過去兩年,AI 模型的命名規則大家心裡都有一套——Pro 是旗艦,Flash 是縮水版便宜貨。要省錢用 Flash,要做難題用 Pro。OpenAI 也是這個結構(4o / o1)、Anthropic 也是(Sonnet / Opus)、Google 自己也是(Pro / Flash / Flash-Lite)。
這次 Google 做了一件反直覺的事:它把「agent 該有的智慧」整片下放到 Flash 這一層,然後讓這個 Flash 變成 9 億人手機上 Gemini app 的預設模型。
4×
FASTER OUTPUT
1M
CONTEXT TOKENS
$1.5
INPUT / 1M
900M
GEMINI APP USERS
900 萬到 9 億,是 Pichai 在 keynote 上甩出的數字——Gemini app 一年內成長 2.25 倍。當你把 agent-grade 的智慧設成這 9 億人的預設,意味著什麼?
意味著 agent 不再是付費 SaaS 才有的功能。意味著一個學生用 Gemini app 整理筆記、一個剪輯師用 Gemini Spark 排素材、一個小老闆用 Antigravity 跑進貨流程,他們不知道自己在用 agent。他們只是覺得「Google 變聰明了」。
這是擴散戰。
OpenAI、Anthropic、Google 的三條路
OpenAI
用 GPT-5.5 守住高端 chat 與 reasoning。Pro 與 Plus 賣訂閱,靠頂規打知名度。
Anthropic
Opus 4.7 賣給高階開發者與企業,coding、長文、合規這三塊建立護城河。
把 Pro 級智慧塞到 Flash 級價格,當 9 億 Gemini app 用戶的預設模型,農場化普及 agent。
三條路沒有對錯,但對誰最不利很清楚——這套打法直接撞到還在用 Pro 訂閱當主要收入的玩家。如果用戶在免費 Flash 上跑完一個 agentic 任務的滿意度,跟在 Pro 訂閱裡跑差不多,誰還會付那一個月二十美金?
CHAPTER 04 · FOR DESIGNERS
設計師可以怎麼用
跑分歸跑分,落到設計師工作桌上才是重點。3.5 Flash 配合 Antigravity 與 Omni 這套組合,能解鎖四個場景。
01 · 批次素材處理
Google 官方在 keynote 演示的第一個案例就是這個——把一堆亂七八糟的素材丟給 Antigravity,3.5 Flash 跑 subagent 自動命名、分類、套規則整理。對你來說,這就是「把 100 張客戶傳來的參考圖按風格分類」「給每張 dribbble 截圖加 tag 入庫」這類沒人想做但每週都要做的瑣事。原本用 Photoshop 動作或人工處理的事,現在可以丟給 agent。
02 · 多檔案 vibe coding
Antigravity 裡 3.5 Flash 能跨多檔案跑 long-horizon 編輯。Google 演示其中一段是把一個老舊 codebase 改造成 Next.js,agent 自己讀檔、規劃、改、跑測試、反覆迭代。對設計師來說最直接的應用是——做 prototype 不用學完整工程流,丟一句「幫我把這個 Figma frame 變成可互動的 web prototype,用 React + Tailwind」,agent 自己跑。
03 · 影片產線串接 Omni
Flash 寫腳本與分鏡 → Omni 生成影片片段 → 拉進 Flow 或 CapCut 後製。對台灣的內容創作者來說,這個 pipeline 比過去任何時候都接近「一個人做完整支片」的可能性。Omni 的訴求是「對話編輯」——你不用學剪輯軟體,用講的就能改場景、加角色、改動作。
04 · 多模態 UI 探索
官方示範的一個案例:在 AI Studio 上 60 秒生成 4 種不同的 checkout flow UX 概念。對設計師的意義是 ideation 階段的速度被壓縮——以前一個 UX 概念要畫一晚的 wireframe,現在用語言描述、由 Flash 平行生成 4 個版本對比,挑一個再細修。這不是替代設計師,是把「概念探索」這一段從手工變成 prompt 工程。
CHAPTER 05 · WHEN TO USE WHAT
跟 Claude / GPT 怎麼分工
你不用選邊站。我自己現在的工作流是三家都開著,依任務性質切換。把 benchmark 翻譯成設計師日常工作後,分工大概長這樣。
任務類型
建議模型
為什麼
批次處理與 agent 任務
Gemini 3.5 Flash
MCP Atlas 領先、速度 4×、成本不到一半。
設計寫作、文章、觀點論證
Claude Opus 4.7
長文敘事、嗓音控制、SWE-Bench Pro 仍強。
純 reasoning、數理、抽象推理
GPT-5.5
ARC-AGI-2 拿 84.6%,HLE 與 Terminal-bench 也強。
長文件 retrieval(百頁以上)
GPT-5.5
MRCR v2 128k 拿 94.8%,遠超 Flash 的 77.3%。
多模態圖表理解、UI 生成
Gemini 3.5 Flash
CharXiv 84.2% 與 MMMU-Pro 83.6% 雙料領先。
日常對話、快速問答
Gemini 3.5 Flash
免費、速度快、品質夠。預設模型就是它。
一個比較不直覺的觀察:如果你是內容創作者,「寫文章」這件事我還是會選 Opus 4.7。Flash 的 agentic 能力強,但寫作的節奏、語氣、嗓音這些細節,Claude 仍有明顯優勢。Flash 適合用來處理「文章前面那一堆素材整理、引用查證、benchmark 對比」這些雜活。
CHAPTER 06 · HOW TO START
在哪可以開始用
免費路徑
最簡單的就是直接打開 gemini.google.com,model picker 切到「3.5 Flash」就能用。同樣免費的還有 Google AI Studio——拿 API key 後可以呼叫,有每日 quota 但對個人實驗夠用。
AI Mode in Google Search 也預設用 3.5 Flash 跑,你查資料的時候已經是它在後面工作。
付費分層(API 定價)
INPUT
$1.50
per 1M tokens
OUTPUT
$9.00
per 1M tokens
CACHED INPUT
$0.15
per 1M tokens
Context window 1,048,576 tokens(也就是常講的 1M),單次最大輸出 65,536 tokens,知識截止 2026 年 1 月。Dynamic thinking 預設開啟,模型會自己判斷該花多少算力。
Antigravity
agent-first 的開發環境,IDE 與 CLI 雙形態。原本的 Gemini CLI 與 Gemini Code Assist 都在收編進 Antigravity,6/18 起停止舊版服務。如果你之前在用 Gemini CLI 跑工作流,這個月就要遷移。
Gemini Spark
個人 24/7 agent。目前只開給 trusted tester,下週進 Google AI Ultra 訂戶 beta(每月 $100 美金那個方案)。一般用戶要再等一段時間。
CHAPTER 07 · WHAT'S NEXT
3.5 Pro 來了會怎樣
Pichai 在台上講六月見。從目前可知的線索推測——Pro 應該補上的是 reasoning 那條線(HLE、ARC-AGI-2),這兩個 benchmark 還在 Opus 4.7 與 GPT-5.5 手上。Pro 也可能延長 long-horizon 任務的執行時間,目前 Flash 的甜蜜點大概在數小時級別,Pro 有機會把這個拉到一兩天。
但對普通用戶來說,Pro 來了改變不會像 Flash 這次這麼大。因為 9 億 Gemini app 用戶的預設模型已經是 Flash,agent 已經是 baseline,Pro 只是一個「再厲害一點」的版本,而不是「從沒有 agent 到有 agent」這種等級的跳變。
Pro 真正的意義是給開發者與企業——Salesforce、Macquarie Bank、Shopify、Databricks、Xero 這幾個官方點名的合作客戶,他們的高階場景需要 Pro 的深度推理。但他們不是這場發表會的目標受眾。Google 這次明顯瞄準的是 consumer 與 developer 中段市場,那塊本來就是 Flash 的地盤。
CHAPTER 08 · TAKEAWAYS
一句話收尾
這場 keynote 表面上是模型發布,骨子裡是一個戰略宣告——Google 押的是 agent 該變成水電瓦斯。把 Pro 級智慧放到 Flash 的價格,是讓 9 億用戶在不用思考的情況下,每天都在跑 agent。
對台灣的設計師、創作者、自由工作者,這意味著兩件事。一是 AI 工作流的成本門檻又被打下來一級,原本要 Pro 才跑得動的長任務現在用 Flash 就行。二是「agent-first」正從一個關鍵字變成預設值。從現在開始,每個工作流都該問一次自己——哪些環節可以交給 agent 自己跑完,而不是手動點到底?
能想到答案的人,這幾年會走得快非常多。
Flash 不是降級。
是 Google 把 agent 從付費功能
變成水電瓦斯的第一步。
CHEATSHEET · 一分鐘懶人包
✦ Gemini 3.5 Flash 5/19 I/O 2026 發布,立即 GA,免費可用
✦ agentic / multimodal 兩條線跑贏自家 3.1 Pro,coding 與 reasoning 仍輸 Opus 4.7 / GPT-5.5
✦ 輸出速度 4×、價格不到一半($1.50 input / $9 output / 1M tokens)
✦ 是 Gemini app 與 AI Mode in Search 的新預設模型,9 億用戶直接吃到
✦ 3.5 Pro 延到六月推出
✦ 設計師最該注意的是 Antigravity + Omni + Flash 組成的 agent 工作流產線
FAQ
常見問題
Q:Gemini 3.5 Flash 在哪可以用?
A:Gemini app(手機與桌面)的 model picker 切「3.5 Flash」即可,免費。開發者可從 Google AI Studio 拿 API key 呼叫,或在 Antigravity 與 Android Studio 中使用。AI Mode in Google Search 也已預設使用 3.5 Flash。
Q:Gemini 3.5 Flash 跟 Claude Opus 4.7、GPT-5.5 怎麼選?
A:agent 工作流、批次任務、多模態理解選 3.5 Flash;長文寫作、設計觀點論證選 Claude Opus 4.7;純推理、抽象問題、長文件 retrieval 選 GPT-5.5。三家都開、依任務切換是目前最划算的用法。
Q:3.5 Pro 什麼時候出?跟 Flash 差在哪?
A:Google 宣布六月推出。Pro 預期會補上深度推理(HLE、ARC-AGI-2)與更長的 long-horizon 任務執行能力。但對普通用戶來說,Pro 的衝擊不會像 Flash 這次大——Flash 已經是 9 億人的預設模型。
Q:API 價格多少?
A:Input $1.50 / 1M tokens;Output $9.00 / 1M tokens;Cached input $0.15 / 1M tokens。Context 1M、單次輸出最高 65,536 tokens。比起其他前線模型,整體成本不到一半。
Q:Antigravity 是什麼?跟 Gemini CLI 差在哪?
A:Antigravity 是 Google 的 agent-first 開發平台,IDE 與 CLI 雙形態並存。原本的 Gemini CLI 與 Gemini Code Assist 都將收編進 Antigravity,6/18 起舊版停止服務。如果你之前在用 Gemini CLI,這個月就要遷移過去。
Q:Gemini Spark 是什麼?什麼時候能用?
A:Gemini Spark 是個人 24/7 AI agent,跑在 3.5 Flash 上,能在你授權範圍內主動完成任務。目前只開放給 trusted tester,下週進 Google AI Ultra($100 美金/月)訂戶 beta,一般用戶要再等。
Q:免費版有什麼限制?
A:Gemini app 與 AI Mode in Search 的 3.5 Flash 無付費限制,免費全球可用。AI Studio 的 API 有每日 quota,個人實驗夠用、商用要付費。Gemini Spark 與 Omni 部分進階功能限 AI Plus / Pro / Ultra 訂戶。





