那些脆上爆紅的圖怎麼做的？完整 ChatGPT Prompt 筆記，自製 IG 風格社群素材

8 組可複製 prompt + 結構拆解｜含真人、VTuber、IP 角色實證對照

2026年5月4日上午 5:18

AI 設計

PROMPT COLLECTION · 2026

QUICK ANSWER

這是一份正在累積的 ChatGPT Image 2.0 描述詞合輯。我邊用邊把脆上爆紅、跑得出好結果的 prompt 留下來，分成「人像 / 角色設計」「插畫 / 動漫風」「海報 / 設計稿」三大類，目前收 9 組。每組都有作品縮圖、可複製的完整描述詞，跟一句我自己的觀察。先看 Prompt 結構拆解掌握寫法邏輯，再從你需要的類別找靈感。

CHAPTER 01

WHY THIS COLLECTION

為什麼要做這份合輯

ChatGPT Image 2 上線之後，社群上每天都有人丟出讓人眼睛一亮的作品。問題是 prompt 不像 Midjourney 有 --ar 16:9 這種規格化參數，它每一組都是大段自由敘述。看到當下覺得「這寫得真好」，過幾天要用就找不到。

這篇就是我自己的解法：把跑出好結果的 prompt 集中收進來，按使用情境分類，每組都標清楚這個寫法為什麼有效、關鍵詞在哪裡。這份會持續更新 —— 每次有新發現我就回來補。

「Prompt 不是寫得長就好，是寫得有層次。」

CHAPTER 02

PROMPT ANATOMY

一段好 Prompt 的六個層次

看別人的 prompt 之前，先把骨架看懂。ChatGPT Image 2 不像舊版 DALL-E 只認關鍵字堆疊，它讀的是敘事。把這六個層次想成寫作的骨架，每一層都答清楚，圖就會準。

STYLE / MEDIUM

風格與媒材

先說這張圖是什麼類型 ——「anime illustration」「3D render」「analog film photography」「watercolor」⋯⋯ 風格是骨幹，影響所有後續判讀。

SUBJECT

主體

畫面的主角是誰／什麼。年齡、性別、種族、服裝、表情都寫在這層。越具體越穩定，模糊描述會讓圖隨機亂飄。

ACTION / MOOD

動作與情緒

主體在做什麼、感覺像什麼。「looking thoughtfully」「mid-stride」「contemplative」這層決定圖有沒有故事感，不是只擺 pose。

SCENE / COMPOSITION

場景與構圖

背景在哪、視角從哪看。「low-angle shot」「rule of thirds」「centered composition」「shallow depth of field」這層直接決定畫面節奏。

LIGHT / TEXTURE

光影與質感

「golden hour」「soft rim light」「film grain」「matte finish」⋯⋯ 質感詞是把作品從「能看」推到「好看」的關鍵。沒這層的 prompt 圖會偏塑膠感。

DETAIL / CONSTRAINT

細節與限制

最後補上鏡頭規格、比例、顏色限制（「muted earth tones」「2:3 portrait」）。這層是收口，把前五層的方向釘死。

下面三大類別的 prompt 都是循這個結構寫的。看的時候可以對照看每一段對應到哪一層，慢慢就能自己組。

CHAPTER 03

HUMAN & CHARACTER

人像／角色設計

擬真人像、角色設計卡、cinematic 視覺主視覺。這類 prompt 通常會寫得比較結構化 —— 用編號分層、標註優先級、明確指定材質與光影，把模型可能崩壞的每個面向都釘死。

ChatGPT Image 2 cinematic 主視覺 — 狼耳 VTuber 破屏而出

ChatGPT Image 2 cinematic 主視覺 — 黑髮女生破屏而出

▲ 同份 prompt 跑出的兩個成果｜左：狼耳設計師 wolf mode｜右：黑髮女設計師 in my own world

PROMPT 03–01

Create a hyper-realistic, cinematic scene that looks as if I am stepping out of my own social media post into the real world.

1) Main concept and pose (highest priority)
Place me inside a smartphone screen showing a social media post, and reposition my body so it looks like I am breaking out of the screen into reality. One foot must extend strongly toward the viewer in dramatic 3D perspective, creating a powerful sense of depth and immersion. The pose should feel dynamic, natural, and physically convincing, as if I am mid-step coming out of the screen.

2) Social media app-style interface (not an exact brand replica)
Create a realistic mobile social media interface inspired by a modern photo-sharing app. Use a clean, familiar layout with: a top header area; profile photo and account name area; post image area; social interaction icons (like, comment, share, save); bottom navigation icons. The username should appear clearly as "帳號顯示名稱" in: the top header area; the visible account name area. Do not use official logos or an exact branded UI replica. Keep the interface original but highly realistic and recognizable as a social media.

3) Screen-breaking effect and visual impact
At the point where the screen breaks, add: realistic shattered glass fragments; floating digital pixel fragments; debris bursting outward into the air. The breaking effect should blend naturally with the subject and the phone, with believable motion and depth.

4) Cinematic realism and rendering quality
Use ultra-realistic cinematic lighting; natural skin texture; high-detail materials; shallow depth of field. Ensure realistic shadows; accurate reflections; advanced depth layering; strong separation between foreground, subject, phone, and background.

5) Composition and framing
Optimize the image for a vertical 4:5 aspect ratio (1080×1440) for social media feed use. Requirements: No cropping; No cut-off interface elements; No loss of important visual information; Full clarity and balanced composition. Use an original, non-branded interface design. Do not replicate any copyrighted app UI exactly.

Riven 筆記　上面兩張並排是同一份 prompt 跑出的不同成果 —— 一個是動漫 VTuber 主體（左邊狼耳少年）、一個是寫實人物主體（右邊黑髮女生）。模型不在乎你是動漫還是真人，「破屏而出 + 3D 透視大腳 + 玻璃碎片 + 模擬社群介面」這套構圖語言一致到位。三個值得偷學的技巧：（1）在主概念後面標註「highest priority」直接告訴模型哪個元素不能崩；（2）「inspired by... Do not use official logos」這種寫法既得到熟悉視覺又規避品牌侵權，跑出來的介面像 IG 又不是 IG；（3）最後一段直接指定「vertical 4:5 aspect ratio (1080×1440) for social media feed use」把產出規格釘死，可以直接拿去發社群不用二次裁切。把這份 prompt 當成你寫複雜視覺需求時的骨架模板，「帳號顯示名稱」那行換成自己的名字就能跑。

▲ 同份 prompt 跑出的兩個成果｜上：狼耳設計師看 KBO 富邦／台鋼｜下：黑髮女設計師看中華職棒樂天／統一獅

PROMPT 03–02

請參考我上傳的角色圖片，生成一張「台灣職棒電視轉播截圖感」的寫實風格圖片。

畫面是一個在棒球場觀眾席被轉播鏡頭拍到的瞬間，我的角色坐在觀眾席中間，穿著主場球衣或應援風服裝，手上拿著加油棒、應援板或飲料，表情自然，帶一點愣住、專注看球賽的感覺，視線看向球場側邊。

人物外觀請忠實還原我的角色設定，包括髮色、髮型、五官特徵、整體氣質與服裝細節。整體感覺像是轉播鏡頭剛好捕捉到的觀眾席特寫，不是棚拍，不是刻意擺拍。

場景為棒球場觀眾席，周圍有其他觀眾，前景和背景人物略微失焦。使用長焦鏡頭、淺景深、真實轉播攝影機視角，畫面有自然的電視轉播色調、些微壓縮感、輕微動態模糊，整體像真實體育轉播畫面。

左上角加入台灣棒球轉播風格的比分板介面，包含隊名、分數、局數、B/S/O 燈號與中文轉播資訊，版面像真實電視轉播圖卡。

16:9 橫式構圖，高真實感，高細節，自然皮膚質感，觀眾席偷拍感，電視截圖感。

USAGE上傳自己照片或角色設定圖即可替換主體。

Riven 筆記　這份跟 03–01 是 cinematic 兩個極端的對照組 —— 03–01 走「高度合成 + 戲劇化視覺特效」（破屏、玻璃碎片、3D 透視大腳），這份走「電視轉播視角 + 紀實感」（轉播鏡頭壓縮、長焦淺景深、輕微動態模糊）。一個目的是「驚艷」，一個目的是「真實到讓人覺得有梗」。

三個 prompt 寫作技巧值得偷學：（1）反向限制句「不是棚拍，不是刻意擺拍」是核心 —— 模型預設會把人放在最美的角度、最好的光線，明確下「不要 pose」的指令才能逼它跑出紀實感；（2）用攝影技術術語釘死視覺感 ——「長焦鏡頭、淺景深、輕微動態模糊、電視轉播色調、些微壓縮感」這幾個詞讓模型直接調取「體育轉播畫面」的視覺特徵庫，比「請畫得像電視截圖」精準十倍；（3）「左上角加入台灣棒球轉播風格的比分板介面」這個指令最妙 —— prompt 沒寫具體版面（B/S/O 燈號顏色、隊名色塊配色、字體選擇），但模型自己腦補出超還原的台灣轉播圖卡，連富邦悍將的隊徽配色、統一獅的應援板紅黑底、登峰造極四個字都對得上。這對台灣設計師是直接可用的迷因素材生成器：把自己角色丟進演唱會、捷運車廂、夜市、火鍋店任何台灣日常場景，「左上角加入 [節目／轉播風格] 介面」這個結構都能套。改寫這份 prompt 的關鍵字（場景、服裝、左上角介面），就能跑無限版本。

ChatGPT Image 2 K-pop 直拍縮圖 broadcast UI 模板 prompt 範例 — 動漫狼耳少年版 Hearts2Hearts 니니（NiNi）입덕직캠，紫藍霓虹舞台、耳麥、tech-wear 黑白配色、右上 M2 紫紅角落徽章、左下입덕직캠白藍標籤、底部 3:48 時長框

ChatGPT Image 2 K-pop 直拍縮圖 broadcast UI 模板 prompt 範例 — 真人 K-pop idol 版 Hearts2Hearts 니니（NiNi）입덕직캠，紫藍霓虹舞台燈泡牆、黑長髮、耳麥、白襯衫黑領帶制服風、右上 M2 紫紅角落徽章、左下입덕직캠白藍標籤、底部 3:42 時長框

▲ 同份 prompt 跑出的兩個成果｜左：動漫狼耳少年版（portrait 餵 VTuber 角色設定圖）｜右：真人 K-pop idol 版（portrait 餵真人照片）

PROMPT 03–03

Use the uploaded portrait as a reference for the subject's overall vibe and impression.

Create a high-quality K-pop music show fancam thumbnail in a horizontal 16:9 format.

group name: [GROUP_NAME]
member name: [MEMBER_NAME]

Main objective:
- The final image must closely follow the visual layout structure of a typical K-pop fancam thumbnail.
- The layout of the text and graphic elements should remain consistent and fixed.
- The person should appear as the clear main subject in a large close-up composition.
- The overall image should feel like a bright, polished, highly clickable YouTube music show thumbnail.

Editable field rules:
- If [GROUP_NAME] is filled, use it exactly.
- If [GROUP_NAME] is blank or AUTO, automatically generate a natural and stylish K-pop group name.
- If [MEMBER_NAME] is filled, use it exactly.
- If [MEMBER_NAME] is blank or AUTO, automatically generate a natural and stylish member name.
- If [TOP_RIGHT_BADGE_TEXT] is filled, use it exactly inside the top-right badge.
- If [TOP_RIGHT_BADGE_TEXT] is blank or AUTO, use "M2".

Automatic rules:
- The bottom-left label text must always be "입덕직캠".
- The video duration in the bottom-right corner should be automatically generated as a natural random time between 3:00 and 5:00.
- The stage concept, lighting, and facial expression should be automatically chosen based on the subject's vibe.

Subject depiction:
- Use the uploaded portrait as a vibe and appearance reference, not as a strict one-to-one copy target.
- Preserve the overall impression, face shape, eyes, hairstyle, and soft identity cues.
- Reinterpret the subject as a K-pop idol in a music show close-up thumbnail.
- The face must be the strongest focal point in the frame.

Composition:
- Horizontal 16:9 thumbnail.
- Tight close-up or upper-body close-up.
- The subject should occupy most of the frame.
- The face should be centered or slightly right-centered, leaving clean text space on the left side.
- The subject's expression should be vivid, attractive, and thumbnail-friendly.

Stage mood:
- Make it look like a real K-pop stage performance moment.
- Use glamorous concert lighting, LED background glow, and vivid stage colors.
- Preferred lighting colors may include pink, purple, blue, cyan, or neon tones.
- Background should support the idol but not overpower the face.

Styling:
- K-pop stage outfit styling.
- A headset microphone or in-ear monitor may be included naturally.
- Hair, makeup, and styling should feel polished, modern, and performance-ready.

STRICT GRAPHIC LAYOUT RULES:
The thumbnail must use a fixed, repeatable broadcast-style layout.

1) Top-right badge:
- Place a pink angular corner badge in the top-right corner.
- The badge should sit tightly inside the upper-right corner with a small margin.
- Put [TOP_RIGHT_BADGE_TEXT] inside the badge.
- The text should be bold, white, clean, and clearly readable.
- The badge should visually resemble a broadcast/music-show corner mark.
- Keep this badge small to medium in size, not too dominant.

2) Bottom-left label:
- Place a small "입덕직캠" label in the lower-left area.
- It should appear above the group name and member name.
- Use a compact rectangular or speech-bubble style box.
- The box should be white and blue or similar high-contrast broadcast styling.
- The label should be small but crisp and immediately readable.

3) Group name:
- Place [GROUP_NAME] directly below the "입덕직캠" label.
- Align it to the left edge of the label block.
- The group name should be medium-sized, bold, and white.
- It should be clearly readable but smaller than the member name.

4) Member name:
- Place [MEMBER_NAME] directly below the group name.
- Align it with the left-side text stack.
- This must be the largest text element in the thumbnail.
- Use bold white Korean typography with strong readability.
- The member name should dominate the lower-left text hierarchy.

5) Bottom-right duration:
- Place the time-duration box in the bottom-right corner.
- Use a small rounded black rectangle with white time text.
- The time should look like a typical YouTube duration marker.
- Keep it compact and neatly aligned to the lower-right edge.

Text hierarchy:
- Largest text: [MEMBER_NAME]
- Medium text: [GROUP_NAME]
- Small label text: "입덕직캠"
- Small badge text: [TOP_RIGHT_BADGE_TEXT]
- Small duration text: random time between 3:00 and 5:00

Typography style:
- All Korean text must be accurate, natural, and highly readable.
- Use bold, clean, broadcast-style typography.
- The member name should be especially thick and visually powerful.
- The layout should feel polished and consistent, as if taken from a real music-show thumbnail template.

Visual direction:
- Bright, sharp, saturated, broadcast-style image
- Highly clickable K-pop thumbnail energy
- Strong face focus
- Clean and consistent placement of graphic elements
- Realistic but polished idol-performance mood

Negative prompt:
low quality, blurry image, distorted face, incorrect Korean text, unreadable typography, messy layout, misplaced graphic elements, weak thumbnail composition, face too small, cluttered background, sloppy badge placement, inaccurate duration box, awkward text alignment, poor broadcast UI styling

USAGE方括號變數可填入指定值或留 AUTO 讓模型自動生成；上傳自己照片或角色設定圖作為 portrait reference。建議避開真實 K-pop 藝人名稱以免侵權，自訂團名與成員名更安全。

Riven 筆記　上面兩張並排是同份 prompt 跑出來的不同成果 —— 一個是動漫狼耳少年（portrait 餵 VTuber 角色設定圖）、一個是寫實 K-pop idol（portrait 餵真人照片），主體質感截然不同但 broadcast UI 版面語言完全一致：右上 M2 紫紅角落徽章、左下白藍 입덕직캠 標籤、團名 Hearts2Hearts、成員名 니니（NiNi）、右下時長框，五個元素位置都對得上。模型不在乎 portrait reference 是動漫還是真人，「STRICT GRAPHIC LAYOUT RULES」釘死的版面結構照樣穩穩生出。

這是合輯裡寫得最長、結構也最完整的一份 —— 60 行設計規格書直接餵給模型。重點在它做了兩件其他 prompt 沒做的事：（1）用 [GROUP_NAME]、[MEMBER_NAME] 這種變數加上「If blank or AUTO」的 fallback 規則，把 prompt 真正變成「可重用模板」 —— 下次跑系列縮圖只改方括號裡的值就好，連預設值都幫你想好；（2）「STRICT GRAPHIC LAYOUT RULES」分 5 區編號（右上徽章／左下標籤／團名／成員名／右下時長），每區指定位置、大小、顏色、文字 —— 等於把設計稿規格書直接寫進 prompt，模型完全照寫。學會這套邏輯，任何 broadcast UI 風縮圖都能套：把 K-pop 換成 NBA 賽事、把入덕직캠 換成「獨家專訪」或「3 分鐘看懂」，prompt 結構幾乎不用動，跑出來的縮圖就會是完整可用的影片封面。

本章節持續更新中

CHAPTER 04

ILLUSTRATION & ANIME

插畫／動漫風

日系動畫、賽璐璐、Studio Ghibli、新海誠光感、watercolor anime ⋯⋯ 這類的關鍵在「風格層」要直接點名特定畫風流派，模型才不會給你不上不下的擬真插畫。

▲ 同份 prompt 跑出的兩個成果｜左：狼耳設計師 wolf mode｜右：哥德女僕 maid mode

PROMPT 04–01

生成一張你想象中的「我」的插圖。日系插畫風、角色特徵鮮明、情緒自然表情、半身構圖、動態姿態、服裝細節精緻、手繪塗鴉風、潑墨筆觸、隨性線條、粉彩與墨色混合、漫畫草稿質感、白色簡約背景、周圍符號化元素點綴、氛圍感強、高細節、高品質。

USAGE上傳你的照片即可替換主體。

Riven 筆記　上面兩張並排是同一份 prompt 跑出來的不同成果 —— 一個是 tech-wear 狼耳少年（焦黑藍）、一個是哥德蘿莉風女僕（粉黑），主體截然不同但畫面語言一致：粉彩塗鴉、手寫文字、漫畫草稿質感的線條節奏、周圍符號化點綴。模型不是「畫一個角色」，它是把「日系插畫風 + 手繪塗鴉風 + 潑墨筆觸 + 漫畫草稿質感」這四個風格詞當成一套濾鏡，套到任何主體上。

風格詞堆疊有層次感是關鍵：「日系插畫風」定基調、「手繪塗鴉風 + 潑墨筆觸」給質感、「漫畫草稿質感」給線條。最容易被忽略但最關鍵的是「周圍符號化元素點綴」這句 —— 沒這句畫面就是普通動漫人像，加了之後才會有那種「角色海報」的辨識度。我自己的 VTuber 形象（左邊那張）就是用這套跑出來的，餵自己的照片或描述進去就能玩。

▲ 反向降級鼠繪風｜跟 04–01 同樣是 input-to-output，但方向完全相反

PROMPT 04–02

Redraw the attached image in the most clumsy, scribbly, and utterly pathetic way possible. Use a white background, and make it look like it was drawn in an old computer painting program with a mouse. It should be vaguely similar but also not really, kind of matching but also off in a confusing, awkward way, with that low-quality pixel-by-pixel feel that really emphasizes how ridiculously bad it is. Actually, you know what, whatever, just draw it however you want.

ALSO WORKS · 延伸應用

▲ 同一份 prompt 不只能畫角色 —— 連我的 Instagram 個人頁面整張截圖都能用鼠繪語言重畫一次

Riven 筆記　這份跟 04–01 是同一個 input-to-output 模式，但目標完全相反 —— 04–01 是把真人照片升級成精緻插畫，這份是把精緻插畫降級成醜醜鼠繪。為什麼有人這樣玩？因為 AI 圖太完美已經造成審美疲勞，「故意畫得很差」的反差感反而變成新的藝術語彙。技術上有三個值得偷學的地方：（1）三個形容詞層層加碼「clumsy, scribbly, and utterly pathetic」把方向釘死；（2）「vaguely similar but also not really, kind of matching but also off」這種矛盾敘述故意製造 confusion，逼模型放下「要畫好」的內建傾向；（3）最後一句「Actually, you know what, whatever, just draw it however you want」是天才一筆 —— 鬆綁式收尾反而給模型更大發揮空間。最讓人驚豔的是這份 prompt 的 input 不只能吃角色插畫 —— 上面那張我直接餵了自己的 IG profile 截圖，模型連限時動態圈圈、貼文九宮格、追蹤數字、雙語介面元素都用同一套塗鴉語言重畫一次。拿來做 ironic 頭像、nostalgic 風格社群素材都很實用。

▲ 條列版 prompt 跑出的兩個成果｜白筆手寫日記註記

PROMPT 04–03

觀察照片中的元素，並為每個元素增加有意義的手繪註記。

【圖片中有什麼】
（這裡填寫照片中的項目）

【線條規則】
・像白筆一樣細的手繪線條
・單筆刷式粗糙、略有不平均
・加上輪廓沿著物體外圍
・用箭頭和虛線建立凝視指引

【文字規則】
・日文手寫字（70% 平假名、30% 溫柔漢字）
・簡短、類似獨白的評論
・語氣是「日記、一件事、感情」

【評論生成規則】
・飲料 → 味道、溫度、心情（例如：清爽、溫和的甜味）
・食物 → 質地、美味（例如：濕潤、棒）
・空間 → 氣氛（例如：平靜、美好時光）
・整體 → 一個字總結（例如：太開心了～）

【裝飾】
・增加蒸氣、閃亮、愛心、小表情符號等
・不要過量，留下「空白」

【完成】
・Instagram 限時動態風格，粗略備忘風格
・粗糙的氣氛，像一本日記

ALSO WORKS · 換種寫法

▲ 散文敘述版 prompt 跑出的兩個成果｜不用條列規格書一樣到位

一位時尚有型的年輕女子正在對鏡自拍，穿著休閒服裝（寬鬆外套、無袖上衣、寬褲），手持飲料杯，自然光線，現代都市背景（咖啡廳／街道／室內極簡空間）。

在主體周圍添加白色手繪塗鴉：頭上的貓耳朵、小貓角色、星星、愛心、箭頭、動態線條、對話框，以及「coffee time」、「fit check」、「thinking」等俏皮註釋。塗鴉應與主體互動（跟隨身體輪廓、強調姿勢、在腿和手臂上添加動態線條）。

柔和美學，日韓流行風格，略帶光澤感，舒適氛圍，Instagram 美學，構圖乾淨，高細節，淺景深，自然膚色。白色素描線條，略帶粗糙的手繪風格，簡約而富有表現力，構圖平衡。

Riven 筆記　這份 prompt 角度跟前面所有都不一樣 —— 它不是叫模型生成新主體，是叫模型「看著這張照片寫日記」。本質是把 ChatGPT Image 2 當成後製工具用，類似 Photoshop 的圖層註記功能但全自動化。整份結構值得收進工具箱：用方括號標題分區（圖片中有什麼／線條規則／文字規則／評論生成規則／裝飾／完成），每區內用條列式列出限制條件。三個最巧妙的細節：（1）「線條規則」分得超細 —— 不只說「白筆細線」，連「單筆刷粗糙不平均」「沿物體輪廓」「箭頭和虛線建立凝視指引」都拆出來；（2）「評論生成規則」用條件分支寫法（飲料→這樣寫、食物→那樣寫、空間→另一種）；（3）「裝飾不要過量，留下空白」這句逆向限制超關鍵 —— 模型預設會塞滿，明確要它「留白」才不會花成一團。

上面兩個區並排比的是「同份 prompt 兩個成果」—— 條列版（上）跑出ときめき系列、散文版（下）跑出 coffee time 系列。差別在哪？條列版適合「精準控制每個細節、可重用的模板」，散文版適合「快速生圖、一次性需求」。挑哪種看你要的是「資產」還是「結果」。

本章節持續更新中

CHAPTER 05

POSTER & GRAPHIC

海報／設計稿

電影海報、活動主視覺、Swiss style、editorial layout、retro print。這類的勝負在「構圖層 + 細節層」要明確指定版面結構與字體層級，不然會跑出一張只是「好看的圖」而不是「能用的設計稿」。

▲ 角色宣傳海報｜雙重曝光拼貼敘事 ✕ 東方水墨留白

PROMPT 05–01

一張「喜多川海夢」的人物宣傳海報，統一採用直式主視覺構圖。每張海報皆使用上大下小的層級結構：畫面上半部以人物最具辨識度的頭部、臉部輪廓、面具或半身外輪廓作為巨大的視覺主體，形成高辨識度的剪影式主形；中下部安排完整人物作為第二主體，呈現穩定站姿或輕微動作姿態，構成畫面的視覺核心。

大輪廓內部以及角色周圍採用雙重曝光與拼貼式敘事構圖，將多個場景、意象、小型人物關係、輔助元素與環境層層融合於雲霧、水墨與留白之中。左右兩側配置呼應性的輔景，使畫面產生故事張力與空間變化。以一條貫穿畫面上下的流動線索，連結主角色、內部拼貼與上方大輪廓，強化整體性與視線引導。

整體畫面保留大面積留白，邊緣以水墨暈染與虛化破碎處理，營造東方美學中的虛實關係與呼吸感。整體風格統一、高級且克制，強調層次感、敘事性、主視覺衝擊力與系列化海報語言。尺寸：9:16。

USAGE喜多川海夢可置換成任何你要的角色，prompt 結構保持不變即可跑系列海報。

PROOF · 跨類型主角對照

▲ 同一 prompt 跑三種完全不同類型的主角 ——「真人 IP（喜多川海夢）」「VTuber 角色（設計師 Riven）」「經典動漫 IP（哆啦A夢）」，構圖語言完全一致

PROOF · 套用同 IP 整套主角

▲ 同一 prompt 模板套用到鬼滅之刃五個主角｜竈門炭治郎、竈門禰豆子、我妻善逸、嘴平伊之助、富岡義勇

Riven 筆記　這 prompt 真正值得學的不是風格，是構圖語言寫得多完整。一般人寫海報 prompt 通常停在「一張某某角色的海報」，這份直接點到四個版面層次：上大下小的層級、雙重曝光的拼貼敘事、貫穿全圖的流動線索、東方水墨的留白虛實。意思是 ChatGPT Image 2 真的吃這套 —— 你越是用設計師術語跟它溝通版面，跑出來越像作品集而不是「AI 圖」。看上面兩組對照就懂了：第一組比的是「跨類型主角」—— 真人 IP、VTuber 角色、經典動漫 IP，三種完全不同類型的主角放在同一個版面語言裡完全成立；第二組鬼滅五兄弟比的是「同一 IP 整套角色」—— 五個角色配色情緒個性完全不同。兩組對照證明同一件事：「上半部巨大頭像 + 下半部全身站姿 + 雙重曝光拼貼 + 水墨留白 + 流動線索貫穿 + 環境意象拼貼」六個版面元素一個不漏。最聰明的是 USAGE 那句：把核心主題抽掉變模板，置換角色就能跑系列海報。這對做 IP 主視覺、人物列傳、品牌大使視覺的人是直接可用的工作流。

▲ 同一 prompt 模板生成三個 IP 主角｜系列化 banner 設計

PROMPT 05–02

畫一幅乙女向暗黑幻想手游 Banner，每張的角色都要不同面貌與姿勢。都是限定 SSR，帶誇張標題、按鈕、特典 UI。

USAGE可指定 IP 角色或上傳自己照片作為主角。

Riven 筆記　這組才是 ChatGPT Image 2 最被低估的能力 —— 它真的能畫出「看起來能用的 UI 介面」。仔細看 Figma 那張的元件清單、原型流程框、Dev Mode 程式碼欄，跟真實 Figma UI 八九分像；Adobe 那張連 Ps、Ai、Pr、Fi 圖標的視覺位階都對。妙的是 prompt 完全沒去描述任何 UI 細節，它只說「誇張標題、按鈕、特典 UI」這種抽象指令，把判斷權讓給模型 —— 越具體列文字反而越會崩。把這份 prompt 收好，IP 主視覺、品牌擬人化提案都用得上。

▲ 同份 prompt 跑出的兩個成果｜左：設計師 Riven 狼耳 VTuber｜右：葬送的芙莉蓮

PROMPT 05–03

「葬送的芙莉蓮」美式厚塗插畫，角色側臉半身特寫，人物視覺還原角色設定，視線朝左，極簡米白背景，大量留白，右側構圖,乾淨高級感，柔和電影級光影，邊緣光，高對比但低飽和配色，角色主色點綴，幾何切面感上色，細緻皮膚與髮絲，商業海報排版，大標題字體設計。9:16 直板。

USAGE「葬送的芙莉蓮」可置換成任何 IP 角色或自己的 VTuber 形象，prompt 結構保持不變。

Riven 筆記　這份跟 05–01 是一對絕配的對照組 —— 同樣是「角色海報模板」邏輯，但藝術語言完全相反：05–01 走東方水墨 + 雙重曝光拼貼 + 上大下小層級，這份走美式厚塗 + 側臉留白 + 商業海報字體排版。一個適合做品牌大使、IP 列傳這類「敘事感重、文化質感強」的視覺；一個適合做雜誌封面、活動主視覺、書籍裝幀這類「商業性強、字體設計搶戲」的視覺。三個值得偷學的技巧：（1）一段話塞進完整六個層次，是合輯裡寫得最緊湊但最完整的範例；（2）「人物視覺還原角色設定」這句把 IP 還原責任丟給模型，比寫死外觀細節更彈性；（3）最後兩個關鍵詞「商業海報排版 + 大標題字體設計」是把這 prompt 從「藝術插畫」推到「可發行的商業視覺」的核心 —— 模型會主動加入豎排書法字、角色名 logo 化處理、副標排版、留白構圖這些設計師才會做的事。把這份 prompt 收好，做品牌主視覺、人物列傳、書籍封面、活動 banner 通通可用。

本章節持續更新中

CHAPTER 06

WHAT I LEARNED

收完一輪，我看到的事

這份合輯收完一輪，9 組 prompt、含多組「兩張並排」的同模板實證對照，我發現一件事：真正改變遊戲規則的不是 ChatGPT Image 2 的畫質，是它讓 prompt 從「一次性指令」變成「可重用的設計資產」。這聽起來像話術，但下面三個觀察會說服你。

INSIGHT 01

主體可被替換，模板才是資產

這份合輯裡有四個 prompt 用同一個邏輯：把句子裡的主角名抽掉變模板，剩下的構圖語言保持不變。05–01 同一份海報構圖 prompt 套到鬼滅之刃五兄弟，五個角色配色情緒個性都不同但版面語言一致；05–02 同一份「乙女向 SSR Banner」prompt 跑出 Figma、Adobe、ChatGPT 三個 IP 主角；04–01 把上傳照片裡的人換成任何主體，塗鴉風格都成立；03–03 更進一步用方括號變數 + AUTO fallback，把 prompt 變成有預設值的程式。會寫 prompt 不再是 AI 設計師的競爭力，會寫「主角可被替換的 prompt」才是。因為前者是一次性勞動，後者是可重複使用的設計資產 —— 你之後做品牌大使、做人物列傳、做系列海報，模板拿出來改一個名字就跑。

INSIGHT 02

Input 的範圍已經模糊到任何視覺都能餵

04–01 餵真人照片跑出精緻塗鴉、04–02 餵精緻插畫跑出醜版鼠繪、再餵一張 IG profile 截圖也能用同一份鼠繪 prompt 重畫整個介面，連限時動態圈圈跟貼文九宮格都保留。模型不在乎你餵進來的是照片、插畫、還是 UI 截圖 —— 它把所有視覺都當成可被風格化處理的素材。這對設計師意味著什麼？意味著 ChatGPT Image 2 已經偷偷取代了一部分的後製工作流。原本要在 Photoshop 做的「加註記、改風格、套濾鏡」現在一句 prompt 就能跑完，而且結果還更有手感。

INSIGHT 03

Prompt 寫法沒有對錯，只有「資產 vs 結果」的取捨

這份合輯裡 9 組 prompt 涵蓋了所有極端寫法：04–01 用中文一段話帶過、03–01 用英文編號分層加優先級標註、03–03 用變數系統 + 60 行設計規格書、04–03 用方括號條列規格書、05–01 用設計師術語寫版面語言、04–02 用矛盾敘述加鬆綁式收尾。每一種都跑得出好結果。差別在於：條列規格書版本適合「精準控制每個細節、可重用的模板」（你之後改哪個元素就改哪行），敘述版適合「快速生圖、一次性需求」（思考成本低、寫作流暢）。挑哪種看你要的是「資產」還是「結果」。把這個取捨想清楚，你就不會再卡在「我的 prompt 寫得對不對」這個假議題裡。

所以這份合輯之後會怎麼長？我會繼續收，但收的標準變了 —— 不是「漂亮的圖」，是「能變成模板的 prompt」。每多一份能複用的描述詞結構，就是設計師工具箱裡多一個槓桿。

「會用 AI 的設計師，跟會把 AI 用法變成資產的設計師，是兩種人。」

IMPORTANT NOTICE

關於動漫角色與 IP 版權的提醒

這份合輯裡用了「葬送的芙莉蓮」「喜多川海夢」「哆啦A夢」「鬼滅之刃」等知名 IP 角色當範例，這只是為了示範 prompt 的「主體可被替換」邏輯，不代表你跑出來的作品可以商業使用。三個原則建議遵守：

（1）個人練習 OK，公開發表前先想一下。模型能跑出來不等於你能合法用，發 IG ／ Threads ／ FB 前先評估這個 IP 的版權擁有者立場（迪士尼、Sanrio、Studio Ghibli 都有主動發函紀錄）。

（2）商業用途請改用自創角色。要做品牌主視覺、課程封面、商業海報，把 prompt 的角色名換成自己的 VTuber ／自創 IP ／真人照片，prompt 結構照舊，視覺語言一樣到位。

（3）同人創作有界線。日本同人圈對動漫 IP 二創的容忍度高，但仍以「非商業 + 不損害角色形象」為前提，這條規則套到 AI 生成同樣適用。

CHAPTER 07

FREQUENTLY ASKED

常見問題

Q1．這些 prompt 直接複製貼上就能跑出一樣的圖嗎？

不會一模一樣。生成式模型每次跑都有隨機性，加上 ChatGPT Image 2 會根據對話脈絡微調。這份 prompt 給的是「方向」跟「結構」，跑出來的風格會接近，細節會不同。建議跑出來不滿意就在後面加一輪 refinement，例如「make the lighting warmer」「more dramatic angle」。

Q2．要用中文還是英文寫 prompt 比較好？

英文目前還是穩。ChatGPT Image 2 對中文 prompt 已經支援得不錯，但風格詞、攝影術語、構圖術語的訓練語料絕大多數是英文，用英文寫精度會高一截。如果中英混用，把核心風格詞用英文、敘事補述用中文是可行的折衷。

Q3．Prompt 寫越長越好嗎？

不一定。重點是「六個層次都答到」，不是字數堆滿。一段 80–150 字、每個層次都點到的 prompt，效果通常比 300 字囉嗦敘述穩定。寫太長反而會讓模型抓不到重點。

Q4．生成出來臉跑歪、手指數不對怎麼辦？

直接把問題部位點名修正：「regenerate with anatomically correct hands」「fix the face proportions, more symmetrical」。ChatGPT Image 2 支援多輪對話修圖，比一次寫死 prompt 更容易拿到滿意結果。

Q5．這份合輯會更新嗎？

會。我把這篇當成「正在累積中的工作筆記」，每次跑出新的好 prompt 就回來補。建議加入書籤定期回來看，或訂閱下方的 AI 覺醒設計應用攻略，每週會把當週新 prompt 整理進電子報。

Q6．哪些 prompt 不能用 ChatGPT Image 2 跑？

真實名人肖像、品牌 logo、暴力／成人內容、可能侵權的角色（如迪士尼、漫威 IP）都會被拒。如果你想要某個藝術家的「風格」而不是「作品」，把畫風特徵寫出來而不是寫名字，例如不寫「in the style of Studio Ghibli」改寫「hand-painted watercolor anime, soft pastoral landscape, warm afternoon light」。

Q7．有推薦的 ChatGPT Image 2 進階學習資源嗎？

RAR 之前有寫過一篇 ChatGPT Image 2 的完整 prompt 寫作指南，從基礎結構到進階技巧都有。這篇圖鑑算是那篇的「實戰補充包」。如果你想系統化學 AI 設計工作流，AI 覺醒設計應用攻略訂閱方案每週都會更新對設計師有用的 AI 應用拆解。

訂閱制✦ AI × 設計趨勢

AI 覺醒設計應用攻略

AI 工具每週都在更新，我幫你過濾雜訊，只整理對設計師真正有用的 AI 應用。每週一封電子報，包含當週新 prompt 整理。

✦　AI 工具實測與工作流分享

✦　設計師角度的 Prompt 技巧

✦　每週精選 AI × 設計新知

了解訂閱方案 →

Curated by 設計師 Riven

那些脆上爆紅的圖怎麼做的？完整 ChatGPT Prompt 筆記，自製 IG 風格社群素材

為什麼要做這份合輯

一段好 Prompt 的六個層次

人像 ／ 角色設計

插畫 ／ 動漫風

海報 ／ 設計稿

收完一輪，我看到的事

主體可被替換，模板才是資產

Input 的範圍已經模糊到任何視覺都能餵

Prompt 寫法沒有對錯，只有「資產 vs 結果」的取捨

關於動漫角色與 IP 版權的提醒

常見問題

AI 覺醒設計應用攻略

人像／角色設計

插畫／動漫風

海報／設計稿