GPT Image 2 是什麼?OpenAI 下一代圖像生成模型的五大升級與設計師應用

從膠帶代號的秘密外洩,到 99% 文字渲染準確率 ― 一篇搞懂為什麼這次 OpenAI 決心要把文字圖像這個老毛病治好
設計師 Riven

設計師 Riven

2026年4月21日 下午 2:53

AI 設計

2025 年 12 月,OpenAI 把 ChatGPT Images 升級到 GPT Image 1.5。當時大家以為那就是年度圖像模型大戲。

結果 4 個月後,三個帶著膠帶主題代號的匿名模型突然出現在 LM Arena ― maskingtape、gaffertape、packingtape ― 幾個小時內生成的範例讓整個 AI 圈安靜了一下,然後被 OpenAI 迅速撤下。

這是GPT Image 2

它還沒有官方發布頁,也還沒開放 API。但部分 ChatGPT Plus / Pro 用戶的生成結果已經悄悄切換到它身上 ― 文字準確率接近 99%、前代那層揮之不去的黃色偏色消失了、中日韓字形第一次被穩定處理。

這篇會拆解:它到底是什麼、五個關鍵升級、跟 Google Nano Banana Pro 的競爭格局、什麼時候能用,以及作為設計師你該準備什麼。

EDITOR'S NOTE ・ 一句話的實測筆記

不小心按到送出,它把整組 IG 輪播做好了

ChatGPT image-2 實測:一句話生成的 IG 輪播素材

▲ 唯一的 prompt 只有一句「介紹一下 ChatGPT image-2」― 結果是這組 IG 輪播素材。

原本只是想試打一句「介紹一下 ChatGPT image-2」,不小心按到送出 ― 結果整組 IG 輪播貼文直接生出來了。我還沒給資料、沒描述風格、沒來得及說規格樣式。

以專業設計師的標準看,頂多60 分。但重點不在 60 分,而是這是一句話就蹦出來的結果。認真下去寫需求、微調 prompt,能做到什麼程度難以想像。

想親自試的話,直接去 ChatGPT 圖像生成打幾個 prompt ― 如果品質明顯比你記憶中好,或是繁體中文字終於清晰了,你就是被分到 GPT Image 2 的幸運兒之一。

本文內所有實測樣本圖皆由作者以 ChatGPT 圖像生成功能(GPT Image 2 灰度測試)親自產出。僅封面圖為社群測試員在 LM Arena 模型下架前截圖保存的樣本,由 TestingCatalog、X 用戶 @levelsio、@Elaina43114880、@marmaduke091、@Angaisb_、@flowersslop 等來源公開分享。OpenAI 官方尚未發布 GPT Image 2 的正式素材。

CHAPTER 01 ・ WHAT IS IT

GPT Image 2 是什麼

GPT Image 2 是 OpenAI 圖像生成模型家族的下一代,繼承自 2025 年 3 月的 GPT Image 1(俗稱「GPT-4o 圖像生成」)和 2025 年 12 月的 GPT Image 1.5。

與前代最大的差異在架構 ― 根據 LM Arena 洩漏樣本的 PNG metadata 分析,GPT Image 2 是完全獨立的新架構,不是 GPT-4o 的延伸。它延續了 GPT Image 家族的自迴歸(autoregressive)生成方式,把圖像一個 token 一個 token 地寫出來,就像寫文字一樣 ― 所以它才能理解「這張圖裡有文字」並把文字寫對。

但是這個版本的規模和深度完全不同。OpenAI 同時測試了三個變體,暗示他們在做最後的平行評估,而不是早期原型。

SPEC ・ 規格對照

項目

GPT Image 1.5

GPT Image 2(測試中)

發布時間

2025/12/16

2026/04 灰度測試

最大解析度

1536 × 1024

4096 × 4096

文字準確率

約 90~95%

接近 99%

生成速度

基準

約 2 倍

CJK 字形

不穩定

筆畫清晰

這些數字不是行銷話術 ― 是 LM Arena 社群測試員和部分獲得灰度存取的 ChatGPT 用戶實際比對出來的。有些來源(如 Startup Fortune 的報導)甚至提到 OpenAI 已經開始分階段推出,但官方文件還沒更新對應的模型卡。

CHAPTER 02 ・ THE LEAK

三個膠帶代號的秘密外洩

2026 年 4 月 4 日,三個匿名圖像模型同時出現在 LM Arena 的圖像生成分類。代號主題一致,全是膠帶:

VARIANT 01

maskingtape

遮蔽膠帶

VARIANT 02

gaffertape

布紋膠帶

VARIANT 03

packingtape

封箱膠帶

幾個小時內,全部下架。

這套劇本不陌生。2025 年 12 月,OpenAI 在同一個平台上以 Chestnut(栗子)和 Hazelnut(榛果)兩個代號匿名測試了新圖像模型 ― 幾週後正式發布的就是 GPT Image 1.5。這是 OpenAI 的標準 canary release(金絲雀釋出)流程:先用代號放到 LM Arena 做盲測,然後在 ChatGPT 做 A/B 流量切割,最後才正式宣布。

而「膠帶」這個主題意味深長。有人把這串代號解讀為 OpenAI 的內部玩笑:這個產品已經準備好「封箱出貨」了。

作者實測 GPT Image 2 生成樣本:複雜場景與文字渲染

除了 LM Arena 的短暫現身,ChatGPT 內部也在同步進行灰度測試。部分 Plus / Pro 用戶開始回報,當他們生成「含大量文字、UI 元素、產品包裝」的複雜圖片時,輸出品質突然變得「好得不像 GPT Image 1.5」― 文字清晰、沒有黃色偏色、排版精準。這是 A/B 流量分配的特徵。

另一個耐人尋味的證據:OpenAI 的 ChatGPT 行動版 App 字串中,已經出現了 Image v2 的命名引用。這通常代表前端整合已經完成,就等伺服器切換。

CHAPTER 03 ・ FIVE UPGRADES

五大關鍵升級

根據社群在模型被撤下前搶救出來的樣本,GPT Image 2 相較 1.5 有五個非漸進式的跳躍:

01 ・ TEXT RENDERING

文字準確率從 90~95% 躍升到近 99%

這是 AI 圖像生成最老的毛病。GPT Image 1.5 時代,短字串還算堪用,但長字串、海報標題、UI 標籤、郵票與標誌常常糊掉。GPT Image 2 的樣本顯示,它能正確渲染 NeurIPS 論文海報這種密集排版的長文本,甚至能畫出每一根針準確對時的時鐘。

02 ・ COLOR NEUTRALITY

消除前代那層揮之不去的黃色偏色

用過 GPT Image 1 / 1.5 的人都知道,它的輸出有一種獨特的「暖黃濾鏡」― 連白牆都會帶一點奶油色。這幾乎是它的簽名缺陷,任何商業素材都得後製校色。GPT Image 2 的樣本色彩中性乾淨,白的是白、黑的是黑。

03 ・ RESOLUTION

4K 原生解析度(4096 × 4096)

GPT Image 1.5 停在 1536。想用在印刷、大型顯示、海報、或任何專業工作流,都得靠外部工具放大。GPT Image 2 直接在模型層支援 4K,把「升頻」這個步驟從專業工作流裡拿掉。

04 ・ CJK SUPPORT

中日韓字形第一次被穩定處理

對中文市場來說這是最重要的一點。GPT Image 1.5 在中文、阿拉伯文、希伯來文的字形渲染始終不穩定 ― 筆畫斷裂、部首錯位、類似字混用是常態。GPT Image 2 的灰度測試回饋中,CJK 字形品質獲得高評價:字形準確、筆畫清晰。對過去必須切換到 Nano Banana Pro 才能處理中文海報的人,這是一個工作流合併的契機。

05 ・ SELF-VERIFICATION

生成後自我校驗再輸出(Recursive Output Verification)

這是最新洩漏出來的一個架構特徵。GPT Image 2 在把圖送到你眼前之前,會先用內部 loop 比對輸出與原始 prompt,如果偏離太多會重生成。這解釋了為什麼它在複雜 prompt(多主體、疊加文字、特定姿勢)上的 prompt 跟隨比前代高出一截。

作者實測 GPT Image 2 生成樣本:UI 介面與複雜排版

想看 OpenAI 官方對自家圖像生成模型的示範,可以先參考他們去年三月發表 GPT Image 1(當時稱為「4o 圖像生成」)的官方展示影片 ― 同一個家族的脈絡:

▲ OpenAI 官方頻道|GPT Image 家族的設計哲學與應用示範Source: YouTube @OpenAI

CHAPTER 04 ・ COMPETITION

vs Nano Banana Pro:三足鼎立的新格局

要理解為什麼 OpenAI 突然加速推 GPT Image 2,得先看看它的對手。

2025 年下半年以來,Google DeepMind 的 Nano Banana Pro 一直佔據 LM Arena 圖像生成排行榜的第一名,特別在信息圖、編輯排版、文字渲染三個領域拉開跟 OpenAI 的差距。根據外流的內部備忘錄,Sam Altman 當時把這個狀態稱為「code red(紅色警戒)」。

GPT Image 2 就是 OpenAI 對這個紅色警戒的直接回應。

MARKET POSITIONING ・ 三方定位

GPT Image 2(OpenAI)

文字渲染與世界知識的新標竿

早期樣本顯示它在文字、UI、世界知識三個類別同時超越 Nano Banana Pro ― 這是很少見的「一次清掃」。對設計師最實用的場景:產品攝影、UI 樣機、電商素材、含中文的海報。

Nano Banana Pro(Google)

信息圖與編輯排版目前仍是王者

即使 GPT Image 2 在測試,Nano Banana Pro 仍在 LM Arena 首位。擅長長文排版、出版級信息圖、多欄雜誌風格。要做報導風格信息圖時仍是首選。

Nano Banana 2(Google)

成本與批量生成的最佳選擇

Pro 版的輕量版本。API 便宜、速度快,適合批量生成電商商品圖、大量 SKU 變體、或需要幾百張縮圖的媒體場景。

也就是說,這不再是「誰最強」的單一軸線競爭,而是變成「根據任務選模型」的多元市場。對專業用戶來說,這反而是好事。

AI 圖像生成的戰爭,終於從「誰畫得比較夢幻」變成「誰畫得比較能用」。

CHAPTER 05 ・ WHEN

什麼時候能用?API 與價格

目前狀態(以 2026 年 4 月下旬為準):灰度測試中,官方還沒發布模型卡頁

ChatGPT Plus、Team、Enterprise 用戶有機會在常規使用中被分流到 GPT Image 2。觀察方法是生成複雜 prompt(UI 截圖、商店招牌、含長文字的海報),如果結果明顯比 GPT Image 1.5 好,你可能就撞到新模型了。

API 預期 5 月初開放,價格推測落在每張 $0.15 ~ $0.20 美元區間 ― 剛發布時會比 1.5 貴 30~50%,但後續會隨推論效率提升而下降。

為什麼五月初是關鍵 deadline?因為DALL·E 的 API 將在 5 月 12 日關閉。OpenAI 必須在那之前給開發者一個明確的遷移目標,否則依賴 DALL·E 的應用會集體斷線。這個 deadline 就是為什麼社群普遍認為 GPT Image 2 的正式發布窗口會在 4 月底到 5 月中。

TIMELINE ・ 關鍵時程

04 / 04

三個膠帶代號出現在 LM Arena,數小時內撤下

04 / 16

ChatGPT 行動 App 字串出現 Image v2 引用

04 / 下旬

ChatGPT 付費用戶灰度推出中(部分報導稱已分階段發布)

05 / 初

API 預計開放給開發者

05 / 12

DALL·E API 永久關閉 ― GPT Image 2 成為唯一遷移路徑

CHAPTER 06 ・ FOR DESIGNERS

設計師該怎麼準備

在 GPT Image 2 正式發布前,有三件事值得現在先做。

ACTION 01

重新審查你的 prompt 庫

GPT Image 2 讀 prompt 比 1.5 更「字面」。以前為了繞過文字渲染缺陷寫的那些 workaround(把文字拆成短句、用引號強調、加 render exact text as)大部分都不再必要。你原本靠經驗寫的 prompt 在新模型上可能反而效果變差 ― 因為那些 workaround 是對老缺陷的補償。建議:先把你最常用的 prompt 整理出來,等新模型開放時逐一測試哪些需要重寫。

ACTION 02

考慮多模型路由的工作流

以前為了處理中文,很多人的工作流是「OpenAI 畫主體 → Nano Banana 補中文文字」。GPT Image 2 之後,一部分中文場景可以由單一模型完成,但 Nano Banana Pro 在信息圖、出版級排版仍有優勢。未來的工作流會更像「不同任務路由到不同模型」― 這是 Manus、Lovable 等平台正在做的方向。花一些時間思考你的任務類型如何對應到最適合的模型。

ACTION 03

現在就開始測試複雜 UI 與信息圖 prompt

如果你是 ChatGPT Plus / Pro 用戶,在常規生成裡多做幾張「UI 樣機」「產品包裝」「含文字的海報」這類複雜圖 ― 撞到 GPT Image 2 的機率會提高。結果明顯比你過去記憶中的 ChatGPT Images 好很多的那一張,很可能就是 GPT Image 2 的輸出。記錄 prompt 與結果,等 API 開放就能直接複用。

作者實測 GPT Image 2 生成樣本:產品攝影與商業素材

CHAPTER 07 ・ PROMPTS IN THE WILD

兩個值得收藏的社群範例庫

如果你想看 GPT Image 2 在真實設計任務裡能做到什麼,最快的方式是看社群已經做出來的東西。以下兩個資源角度不同但互補,都值得收藏:

第一個是 YouMind 做的 GPT Image 2 提示詞集合,目前收錄 560+ 組 X 社群上傳的結構化提示詞 ― 從產品海報、UI 設計系統、美食地圖到廣告橫幅都有。核心是用 JSON 把版面拆成 type / style / layout / sections 欄位,再用 {argument name="..." default="..."} 語法包裝可替換的變數 ― 同一個模板能快速換題材重複產出。

以下挑幾個最能展現 GPT Image 2 多面向能力的範例:產品海報、UI 系統、廣告素材、長圖落地頁 ― 過去需要專業設計師的四種產出類型。

GPT Image 2 產品爆炸視圖海報:Meta Quest 3

TYPE 01 ・ PRODUCT POSTER

產品爆炸視圖海報

@wory37303852 ・ via YouMind

GPT Image 2 UI 設計系統展示

TYPE 02 ・ UI DESIGN SYSTEM

完整 UI 設計系統

@cheatyyyy ・ via YouMind

GPT Image 2 日式數字廣告橫幅 2x2

TYPE 03 ・ AD CAMPAIGN

日式廣告 2x2 網格

@makaneko_AI ・ via YouMind

GPT Image 2 深色模式病毒式營銷落地頁

TYPE 04 ・ LONG-FORM LANDING

深色模式落地頁

@IndieDevHailey ・ via YouMind

值得注意的細節:VR 海報的每個組件標籤都清晰可讀、UI 設計系統能把色票/字體/組件/mockup 整合到一張圖、日式廣告 4 格能一次產出 A/B 測試素材、落地頁把 Hero、時間軸、圖表、CTA 全部保持邏輯一致。

第二個是 EvoLinkAI 在 GitHub 上開源的 awesome-gpt-image-2-prompts,CC BY 4.0 授權,目前 375+ 星、11 種語言 README(含繁體中文)。跟 YouMind 最大的差別是:它依照類別分章,而且完整附上原始 prompt 與原作者 X 連結 ― 對要逐句學習 prompt 寫法的人更友善。

分五大類別:肖像與攝影(8 case)、海報與插畫(15+ case)、角色設計(5 case)、UI 與社群樣機(9 case)、以及一個特別豐富的 比較與社群實驗(30+ case)― 這最後一類專門收集 GPT Image 2 對 Nano Banana Pro / Nano Banana 2 的對戰實測,對正在糾結該選哪個模型的人特別有用。

挑三個最能呈現 GPT Image 2 核心能力的 case:

GPT Image 2 廣州城市宣傳海報範例

TYPE 05 ・ CITY POSTER

雙重曝光城市海報

@liyue_ai ・ via GitHub

GPT Image 2 角色設定資料卡範例

TYPE 06 ・ CHARACTER SHEET

Q 版角色設定資料卡

@tsubaki_ew ・ via GitHub

GPT Image 2 木製書架 prompt 計數測試

TYPE 07 ・ PROMPT TEST

三層書架計數測試

@chetaslua ・ via GitHub

中文海報的字形清晰、角色設定卡結構像官方遊戲設定集。但最值得說的是第三張 ― Prompt「三層書架:最上層 1 本、中層 3 本、底層 7 本」這個看似簡單的任務,Nano Banana Pro、Nano Banana 2、GPT Image 1.5 都要三次嘗試才勉強做對,GPT Image 2 一次就解開

這兩個庫最有價值的地方是可重用性。YouMind 的 JSON 可以直接複製到 ChatGPT 裡,把 default 欄位換成自己的內容;GitHub 那邊的 prompt 通常是自然語言形式(中日英混雜),複製過來改關鍵詞就能用。對做課程、寫部落格、跑廣告的人來說,這等於免費的模板彈藥庫。

CHAPTER 08 ・ RECAP

重點整理

01

GPT Image 2 是 OpenAI 圖像模型家族的下一代,繼承自 GPT Image 1.5,目前在灰度測試。

02

三個代號 maskingtape、gaffertape、packingtape 於 4/4 在 LM Arena 曝光,幾小時內撤下,這是 OpenAI 標準的 canary release 流程。

03

五大升級:99% 文字準確率、消除黃色偏色、4K 原生解析度、CJK 字形穩定、自我校驗。

04

對中文市場最大的意義:第一次有一個主流模型把中日韓字形認真處理。

05

市場格局:GPT Image 2(文字與世界知識)、Nano Banana Pro(信息圖排版)、Nano Banana 2(成本批量)三足鼎立。

06

正式發布窗口預期落在 4 月底到 5 月中,受 DALL·E API 5/12 關閉的 deadline 推動。

07

設計師現在要做的:重審 prompt 庫、規劃多模型路由、開始測試複雜 UI / 信息圖場景。

RESOURCES ・ 延伸資源

OpenAI | The new ChatGPT Images is here(GPT Image 1.5 官方發布頁)

OpenAI | Introducing 4o Image Generation(GPT Image 家族起源)

TestingCatalog | OpenAI tests next-gen Image V2 model(洩漏事件原始報導)

YouMind | GPT Image 2 提示詞集合(560+ 組社群結構化 prompt)

GitHub | awesome-gpt-image-2-prompts(EvoLinkAI 整理的五大類 case 集,CC BY 4.0)

OpenAI API | Image Generation Guide(API 文件,等待 gpt-image-2 模型卡更新)

AI 覺醒設計應用攻略
訂閱制✨ AI × 設計趨勢

AI 覺醒設計應用攻略|RAR 設計攻略訂閱方案

AI 工具每週都在更新,我幫你過濾雜訊,只整理對設計師真正有用的 AI 應用

AI 工具實測與工作流分享

設計師角度的 Prompt 技巧

每週精選 AI × 設計新知

文章標籤

# ChatGPT