Google I/O 2026 重點整理:Gemini Omni、3.5 Flash、Universal Cart 一次看懂
GOOGLE I/O · 2026
QUICK ANSWER
Google I/O 2026 昨晚在 Mountain View 開場,兩天 keynote 的第一天把所有重砲丟完了。最值得記住的兩件事:Gemini Omni 把推理和影片創作合在一起,用對話就能改片;Gemini 3.5 Flash 這個小模型在多項 agentic benchmark 直接贏過自家 3.1 Pro,速度還是 4 倍。Gemini app 改了設計語言、上 Spark 個人 agent、Universal Cart 把購物整合進 Gemini,秋天還會有 Android XR 智慧眼鏡。
SCALE · GOOGLE AI 2026
900M
GEMINI 月活
2x
一年內成長
13
破 10 億用戶產品
5
破 30 億用戶產品
CHAPTER 01 · STAGE
這次 I/O 在現場感是什麼樣的
Mountain View 的 Shoreline Amphitheatre 還是那個老地方,但 Sundar Pichai 一上台就把基調定死:「我們已經把公司轉向 AI 十年了。」這句話在去年聽起來是回顧,今年聽起來是宣告。
整場 keynote 兩小時,幾乎每個產品線都在講同一件事:從「答你的問題」走到「替你做事」。Gemini app 月活破 9 億、一年翻倍,Search 在美國重做了,購物車變成 agent,連 Android 螢幕頂端的狀態列都要重新設計來顯示 agent 在做什麼。
對設計師和創作者來說,這場最重要的不是規格表,是工具棧又要重洗一輪。下面照當天發表順序,我把重點挑出來、加我自己的觀察。每個主題都有獨立的深度專文可以接著看。
CHAPTER 02 · GEMINI OMNI
影片創作進入對話編輯時代
Gemini Omni 是這次最讓設計師該停下來看的東西。它的定位很明確:把 Gemini 的推理能力跟「會做東西」的能力綁在一起。你可以丟任何輸入進去——圖、音、影、文字——它輸出可以用對話編輯的影片。
關鍵不是「能生影片」這件事——Veo、Seedance 2.0、Runway 早就在做了。關鍵是「對話式多輪修圖」這個流程被搬進了影片:你說「把雕像改成泡泡做的」,下一句說「把鏡頭拉到提琴手肩膀後方」,再下一句說「把背景的燈光配著節拍一起亮」,每一輪都會記得前面的設定,角色不會走鐘、物理會合理、場景會連貫。這是過去影片生成工具最弱的一塊。
Omni 真正的策略不在「畫面真不真」這條軸。獨立評測在純生成品質上 Seedance 2.0 跟 Wan 2.7 仍領先,但 Omni 賭的是「來回對話能不能改」——這個賽道幾乎沒有對手。OpenAI 四月把 Sora 縮回 API only,等於退出消費端影片戰場,這個空位 Google 直接補上。把 Omni 同時鋪到 Gemini app、Google Flow、YouTube Shorts 三條線,加上 AI Ultra 從 250 美金降到 200 美金,這是一次協同的攻擊。
Gemini Omni Flash 從今天起在全球的 Google AI Plus、Pro、Ultra 訂閱者開放,介面是 Gemini app 加 Google Flow。YouTube Shorts Remix 跟 YouTube Create App 還免費——對短影片創作者來說,最便宜的入口就是直接打開 YouTube Shorts 試一次「跟你拍過的素材對話」,一輪你就能感覺到差異。
Google 也順手宣布所有 Omni 產出的影片都會嵌 SynthID 隱形浮水印,加上 C2PA 內容憑證擴展到 Search 跟 Chrome,這條 AI 內容溯源的路線終於有點樣子。
DEEP DIVE · 延伸閱讀
Gemini Omni Flash 是什麼?完整能力、應用、跟 Veo / Seedance 的差異 →對話式多輪修片把影片生成從「抽獎」變成「對話」。這是真正的工作流改變。
CHAPTER 03 · GEMINI 3.5 FLASH
Flash 級模型贏過自家 3.1 Pro
Flash 是 Google 模型家族裡的「快又便宜」那條線,過去都是 Pro 才頂得到前沿。這次 3.5 Flash 直接打破這個邏輯——多項 agentic 跟 multimodal benchmark 贏過自家 3.1 Pro,速度還是其他前沿模型的 4 倍。Pro 版說好下個月才開放。
讀數字的方式:Gemini 3.5 Flash 在「使用工具完成任務」這條線是領先的,特別是 MCP Atlas 領先所有人接近 5 個百分點。multimodal benchmark 也是它強項,這跟 Omni 模型的方向一脈相承。
但純推理跟複雜程式還是落後 Claude Opus 4.7 跟 GPT-5.5——SWE-Bench Pro 差將近 10 個百分點,ARC-AGI-2 差 12.5。對日常設計工作流影響不大,但要寫複雜後端、或解 hardcore reasoning 題目,這條線你還是會留在 Claude 或 GPT。
順帶提一個小但有感的變動:Google AI Ultra 從原本的每月 250 美元砍到 100 美元起跳,舊的 250 方案改成 200 美元。Gemini app 也從每日 prompt 限制改成「依運算量」計算,5 小時刷新一次、每週有上限。
CHAPTER 04 · NEURAL EXPRESSIVE
9 億用戶級的 AI 介面範式,第一次正式換代
Gemini app 整個改了一套設計語言,叫 Neural Expressive。如果只看靜態截圖,會以為它只是換了個更柔的暗藍漸層、把字體調圓一點、輸入框變膠囊狀。但這次的重點不在像素,在邏輯。
Gemini UI/UX lead Jenny Blackburn 用了一個很精確的詞描述舊版介面:「the giant wall of text」——一面巨大的文字牆。這四年 ChatGPT、Claude、Gemini、Copilot 全部在用同一套介面範式:使用者打字進去,AI 吐一大段文字出來,捲動、再 prompt、再吐。介面是固定的,內容塞進去。
Neural Expressive 把這件事翻過來:介面跟著內容走。同一個 Gemini,問「羅馬水道怎麼運作」會吐雜誌排版的圖文混排;問「今天的天氣」會吐動態天氣卡;問「幫我比較三個方案」會吐 grid 對照表。Blackburn 的說法是:「不再像是滑無止盡的對話記錄,而像介面有機地圍繞被生成的資訊在重組。」
900M
月活用戶
230
國家/地區
70+
支援語言
四個組成元素都不算新——流動動畫、鮮明色彩、新字體系統、觸覺回饋,這些元素 Material Expressive、Apple Intelligence 都用過。Neural Expressive 的價值不在發明新元素,是把這四件事整合進一套「AI 介面該怎麼長」的明確主張,然後一次推到 9 億用戶面前。
對設計師最該追的是這條訊號:AI 介面的競爭從「對話流暢度」進到「生成式版面」。UI 工作會從「畫螢幕」往「定義語法」推——design system 的權重會從元件庫往生成規則移動。你之後在 Figma 畫的 AI 對話 UI 規範,會被這套範式重新校準一輪。
DEEP DIVE · 延伸閱讀
Neural Expressive 完整解析:四個關鍵元素、對設計師的三個結構性影響 →「我們相信,當這項技術變得更強大,介面反而應該變得更簡單。」
— JENNY BLACKBURN,GEMINI UI/UX LEAD
CHAPTER 05 · GEMINI SPARK
「你可以闔上你的筆電。」
Sundar Pichai 在 keynote 上講了一句話,當下幾乎沒人意識到那是當天最有殺傷力的一句:「是的,你可以闔上你的筆電。」
這句話的對手不是用戶。是 Anthropic 的 Cowork、是 OpenAI 的 ChatGPT Agent。Cowork 跑在你電腦的本機 sandbox,需要你的機器醒著;ChatGPT Agent 在 OpenAI 的雲端跑,但綁在對話介面裡。Spark 兩個都跳過了——它把整套 AI 代理搬進 Google Cloud 的專屬虛擬機,連你的裝置都不需要存在。
三層架構撐起 Spark:底層用今天剛發的 Gemini 3.5 Flash,中層跑 Google Antigravity(自家的 agentic harness,跟 Claude Code 同等位階),執行層是配給你一個雲端 VM。你可以直接 email 給它(每個 Spark 都有專屬 Gmail address),可以在 Gemini app 開 task,之後還會開放 SMS 跟桌面瀏覽器操控。高風險動作(花錢、寄信、刪檔)一律會先問你。
三家 AGENT 賽道對比
Gemini Spark
雲端 VM · Workspace 入口 · 不需要你的電腦開機
Claude Cowork
本機 sandbox · 檔案系統入口 · 適合設計師桌面流
ChatGPT Agent
雲端 · 對話介面入口 · 綁在 ChatGPT 裡
MCP 整合名單也值得記。即日上線只有三家:Canva、OpenTable、Instacart。但 Google 同時公開了未來幾週要陸續接通的整批名單,裡面對設計師有意義的有 Adobe、CapCut、Dropbox、Box、Asana、Atlassian、Salesforce、HubSpot。Google 押的不是「我的模型最強」,是 distribution——你已經有的工具,它都連進來。
第一波給美國 Ultra 訂閱者,下週開放。台灣何時 Google 沒講,但根據過往慣例,Gemini app 的主要功能通常會在數月內推到全球。
DEEP DIVE · 延伸閱讀
Gemini Spark 跟 Claude Cowork、ChatGPT Agent 差在哪?完整比較 →CHAPTER 06 · DAILY BRIEF & WORKSPACE LIVE
Gemini app 跟 Workspace 的小但有感更新
Daily Brief 是個人化的每日摘要——從你的 Gmail、Calendar、Tasks 裡爬出今天該做什麼,幫你排優先序,今天就先在美國的 Plus、Pro、Ultra 開放。對重度開行事曆的人,這是會直接吃掉一塊「每天早上整理腦袋」時間的工具。
Workspace 那邊三條都是「對話化」的延伸:Gmail Live 是對話式搜信,Docs Live 是用對話建立跟編輯文件,Keep 多了一個把零散想法整理成筆記的模式。三個都走「動嘴不動手」的路線,夏天給 Pro、Ultra 訂閱者,從英文先開。對設計師日常的影響不大,但對 PM、客戶、跨部門同事——這幾個工具會慢慢吃掉他們的會議準備時間。
CHAPTER 07 · SEARCH × COMMERCE
搜尋跟購物也要變 agentic
AI Mode 換成 Gemini 3.5 Flash 驅動。搜尋框也重做,標榜「打越多字越會擴展」,AI 預測你的意圖、推查詢建議。這是承認大家現在搜尋句子變長、變對話化了。
Information Agents 是這部分最有想像空間的——你給它一個你關心的主題,它 24 小時跑在背景,掃 blog、新聞、社群、即時資料,有變化就跟你說。夏天會給 Pro、Ultra 訂閱者。對做內容、做研究的人這是一個新工具,過去要用 Google Alerts 加 RSS reader 加自己每天看的,現在它都包了。
Universal Cart 是 Gemini 驅動的購物車,跨 Gemini app、YouTube、Gmail。加入商品後它會自動找優惠、追價、提醒缺貨;要組電腦,它會主動告訴你哪幾個零件不相容、建議替代品;底層接 Google Wallet,會考慮你的卡片回饋、會員等級、商家優惠來建議付款方式。Search 跟 Gemini app 夏天先上美國。
CHAPTER 08 · GOOGLE PICS
Google 第一次把「設計工具」當獨立 app 推上 Workspace 主舞台
這次 I/O 對設計師最直接的訊號之一是 Google Pics。它不是 Google Photos 的延伸——而是一個全新的網頁 app,底層用最新版 Nano Banana 模型,矽谷科技媒體已經有人在用「正面挑戰 Canva 與 Adobe」這個說法,這不算誇張,算是事實的描述。
真正讓人覺得需要記下來的不是模型強,是它選擇切入的角度——把 AI 生圖從「Prompt 賭運氣」拉回「設計直覺操作」。客戶從來不會說「我要 80% 的修改」,只會說「把那張椅子挪過去一點」「把標題換成中文」。前者是 Prompt,後者才是設計工作流真正在做的事。Pics 把後者拉到第一視角。
三大功能值得記下來:物件級分割編輯——點選圖裡的物件單獨換、變色、移動;照片內文字直接改與一鍵翻譯——字體、大小、風格全部保留;Workspace 內嵌——從 Slides 裡直接打開 Pics 改完就回。前兩件 Canva 跟 Adobe Express 都還沒做到,第三件他們十年內都複製不出來——Workspace 4 億用戶的整合是 Google 真正的護城河。
PICS vs 競品的賽道差
Google Pics
AI 生圖 + 物件編輯 + Workspace 內嵌
Canva
模板生態 + 跨團隊協作
Adobe Express
模板 + Firefly 整合
Krea
即時生成速度 + 多模型
限制是它今夏才正式給 Google AI Pro 與 Ultra 訂戶,Trusted Testers 階段現在跑。對台灣設計師現在能做的:先到 Workspace 官網點 Keep me updated 排隊,升級 AI Pro 卡位,再把現有設計工作流盤點一次——哪幾個步驟是「在工具之間切換、複製貼上」,那些就是 Pics 上線後可以重新評估的點。
DEEP DIVE · 延伸閱讀
Google Pics 完整解析:基於 Nano Banana 的精準 AI 圖像編輯,設計師該怎麼看 →CHAPTER 09 · GOOGLE FLOW
Flow 三大更新,第三個才是質變
Google Flow 同場推三大更新:Gemini Omni Flash(前面講過)、Flow Agent、Flow Tools。第一個是模型升級,第二個是 AI 助手,第三個才是真正改變遊戲的東西。
Flow Agent 用 Gemini 跑,定位是「creative partner」:劇本卡關時當對話 sounding board、素材變多時批次套修改、最後幫你分類重新命名。它不是「全自動模式」,更像「會做事的實習生」——你給方向,它跑完回來給你看,你再決定要不要採用。全球 Flow 使用者都能用,不限訂閱方案。
Flow Tools 才是這波最該注意的東西。它讓你用自然語言「vibe code」出創意工具,不用會寫程式。早期合作案例裡,創作者 László Gaal 做了一個叫 pixelBento 的工具,專門幫影片套 lo-fi、glitch 質感的後製濾鏡。其他人想用,點一下就可以 remix 成自己的版本。
工具範式的轉換
過去
固定功能 + 等更新
Figma、Ps、Ai 是廠商定義的工具集合。要做的事不在裡面就只能等更新、寫 plugin、外包工程師。
Flow Tools
按需生成 + 即時 remix
缺什麼工具,描述出來,現場生一個。工具邊界從廠商手上交還給創作者。
把 Flow Tools 放到大圖看,它跟這一年 v0、Lovable、Figma Make 一脈相承——vibe code 正在重塑「工具」這個詞。你不只用 AI 工具,你還可以叫 AI 工具生 AI 工具。
對設計師的意義是能力組合會位移。過去十年的工作流:精通 Figma、會切版、會寫一點 CSS、會剪片、會用 plugin。接下來這幾年的關鍵能力可能變成:會描述想要什麼、會評估產出的好壞、會把零散工具串成自己的工作流。前者是「會操作」,後者是「會思考成品」。後者更難,但也更難被取代。
DEEP DIVE · 延伸閱讀
Google Flow 三大更新:Omni、Flow Agent、Flow Tools 對設計師的真正意義 →CHAPTER 10 · DEVELOPER · BUILD
從 prompt 走向 production
同場對開發者的更新也值得記,雖然不是 keynote 的主菜,但對「未來工作流會長什麼樣」的訊號很強。Google Antigravity 升級到 2.0——這是 Google 自家的 agentic harness,跟 Anthropic 的 Claude Code、OpenAI 的 Codex 同等位階,現在含 CLI、SDK、桌面 app。Google 在 keynote 上炫耀用 Antigravity 寫了一整套 OS,花了不到 1000 美金的 token。Gemini Spark 的底層就跑在 Antigravity 上。
Gemini API 新增 Managed Agents 服務——API 端的 agent 編排,主打可靠性與規模。對需要把 agent 接進產品的團隊而言,這條線等於把「自己手刻 agent 框架」這件事外包給 Google。Google AI Studio 也補上 native Android vibe coding:在 AI Studio 裡直接用自然語言寫 Android app,跟 Flow Tools、v0、Lovable 同屬一條 vibe code 路線。
Android Halo 是螢幕頂端的視覺通道,用來顯示 agent 正在做什麼——這個會在下一章 Android XR 裡再講細節。整體看下來,Google 這次給開發者的東西不少,agent 開發的工具棧正式變成 first-class platform,不再是 SDK 包一包就算完。
CHAPTER 11 · ANDROID XR
智慧眼鏡秋天上市,Android Halo 是新介面語言
Google 把新形態的硬體稱作「intelligent eyewear」,秋天先出 audio glasses。三星跟高通做硬體,外觀設計交給 Gentle Monster 跟 Warby Parker 兩個眼鏡品牌。重要的小字:可以配 Android 手機,也可以配 iPhone。這跟 Meta 的 Ray-Ban 路線正面對撞。
Android Halo 是螢幕頂端的一條視覺通道,用來顯示 agent 正在做什麼。「不用切換畫面,就能看到 agent 進度」這件事是個小介面決策,但意義不小——它在替「agent 在後台跑」這個新常態做 UI 規範。今年稍晚先給 Gemini Spark 用,其他 agent 之後跟上。
CHAPTER 12 · TAKEAWAYS
設計師該追的三件事
整場兩小時看下來,如果你是做設計、做內容的,這三件事最該排進你下週的學習清單:
第一,Gemini Omni Flash。影片生成的關鍵賽道從「畫面真不真」轉到「對話多輪能不能改」。這週就去 Gemini app 開一下 Flow 試試看你的工作流哪一段可以接上去——特別是 Shorts、Reels、短秒數品牌片這類產出。
第二,Neural Expressive 設計語言。不只是 Gemini app 改皮,是 Google 開始把「AI 回答」當成 UI 設計題目來解。對著它的 layout、動畫、訊息分層仔細看一輪,會幫你重新校準「AI 對話介面」的設計直覺。
第三,Flow Tools 跟 Google Pics 這兩條線。前者代表「工具按需生成」這個範式,後者代表「設計工具走進 Workspace 4 億用戶」的市場洗牌。兩個一起看,會看到 AI 時代設計工具的兩個演化方向。
ROLLOUT · 2026
今天
Omni Flash、3.5 Flash
Gemini app、Search、Antigravity 2.0、Flow、YouTube Shorts
下週
Spark
先給美國 Ultra 訂閱者
夏天
3.5 Pro、Pics、Info Agents、Cart、Gmail Live
主力消費功能上線
秋天
XR 智慧眼鏡、Android Halo
硬體跟介面語言一起到
Google 這次 keynote 沒有炫技、沒有「one more thing」,它賣的不是某個單點功能,而是「替你做事」這套世界觀。OpenAI、Anthropic、Google 三家現在的目標都對齊了——agent。差別只在誰先把工作流接到一般人的日常裡,誰就贏。今天看下來,Google 在「接到日常」這件事的進度最快。
WATCH · KEYNOTE
官方完整 keynote
想看現場感、聽 Sundar Pichai 自己怎麼說的,直接看原 keynote:
FAQ · COMMON QUESTIONS
常見問題
Q:Gemini Omni Flash 跟 Veo 3、Seedance 2.0 差別在哪?
A:方向不一樣。Veo、Seedance 2.0 主打從 prompt 一鍵生影片,目標是「擬真度」跟「電影感」。Omni Flash 主打對話式多輪編輯——你給它一段影片或一張圖,用對話一輪一輪改,角色跟物理會保持一致。簡單說:前者是「抽獎」,後者是「修圖式工作流」搬到影片。
Q:Gemini 3.5 Pro 什麼時候上?
A:Google 說目前在測試,預定下個月開放。今天先給 3.5 Flash,是 Flash 級別第一次贏過自家上一代 Pro 的時間點。
Q:Google AI Ultra 從 250 變 100 美元是什麼意思?
A:方案調整。原本 250 美元的方案現在改成 200 美元、能力不變。同時新開一個 100 美元的入門 Ultra 方案,限制比 Pro 多 5 倍。Gemini app 也從每日 prompt 上限改成「依運算量」計算,5 小時刷新一次、有週上限。複雜的 prompt 吃比較多運算。
Q:Neural Expressive 設計語言台灣使用者可以看到嗎?
A:可以。Gemini app 的新設計從今天起在 Android、iOS、Web 三平台同步推送,沒有地區限制。直接打開 Gemini app 就能看到膠囊形 prompt 框、新的 plus 工具選單、改 inline 的 Gemini Live。
Q:Gemini Spark 跟其他 agent 工具比起來怎樣?
A:Spark 走的是「個人助理」路線,整合在 Gemini app 裡、主攻 Workspace 內部任務跟夏天會接的第三方 MCP 工具。跟 Anthropic 的 Cowork 走的是不同路線——Cowork 是桌面端、檔案任務自動化,比較像個工程師助理。先給美國 Ultra,台灣得等。
Q:Google Pics 會威脅到 Canva 嗎?
A:直接對打。Pics 的 demo 場景(生日邀請卡、社群圖、海報)跟 Canva 高重疊。但 Canva 護城河在模板生態、跨團隊協作、品牌資產管理這幾塊,Pics 短期內難複製。對個人 / 輕量使用者是新選擇,對團隊用戶 Canva 還站得住。
Q:Android XR 智慧眼鏡跟 Meta Ray-Ban 比?
A:直接對撞。但 Google 這次跟 Gentle Monster、Warby Parker 合作做外觀,又有三星高通做硬體底層,配置上更貼日常配戴。最有殺傷力的差異是:Android XR 眼鏡可以配 iPhone。秋天上市,會是這條線真正的第一場硬仗。
READ NEXT · I/O 2026 完整專文系列
這篇是概覽。下面五篇是每個主題的深度拆解,搭配看效果更好:
DEEP DIVE · MODEL
Gemini Omni Flash 完整解析
三大核心能力、與 Veo / Seedance 的差異、工作流接入 →
DEEP DIVE · AGENT
Gemini Spark 是什麼
24/7 AI 代理,跟 Claude Cowork、ChatGPT Agent 完整比較 →
DEEP DIVE · DESIGN
Neural Expressive 設計語言
四個關鍵元素、對設計師的三個結構性影響 →
DEEP DIVE · TOOL
Google Pics 完整解析
基於 Nano Banana 的精準 AI 圖像編輯,設計師該怎麼看 →
DEEP DIVE · WORKFLOW
Google Flow 三大更新
Omni、Flow Agent、Flow Tools 對設計師的真正意義 →
CATEGORY
AI 設計工具全分類
其他 AI 工具評測、教學、應用整理 →
























