LoFi Girl 同款音樂影片製作教學:用 Suno + Seedance 2.0 做出你自己的版本

拆解 LoFi Girl 真正的 DNA、用 AI 工具從零做出一支 1 小時 YouTube 影片、附新手五大踩雷清單
設計師 Riven

設計師 Riven

2026年4月14日 下午 2:13

AI 設計

▲ 本文示範影片:〈PIXEL Midnight〉— 我用 Suno + Seedance 2.0 做的一支 Fashion Lo-Fi 版本

PROLOGUE / 前言

大多數人模仿 LoFi Girl 都失敗。原因不是技術不夠好,是想得太像。

你應該看過 LoFi Girl 那個頻道——1430 萬訂閱,一個動漫風女孩在書桌前讀書的循環畫面,配上一段不會結束的 chillhop。這支影片從 2017 年播到現在,累積了幾億次觀看,養出一個十億美金的次文化。它看起來簡單到不行,也因此吸引了無數人想複製。

但你實際去 YouTube 搜一下「lofi hip hop radio」就會發現,絕大多數模仿者都被埋沒在搜尋結果第二頁之後。他們做了跟 LoFi Girl 一模一樣的動漫女孩、一模一樣的 chillhop 節拍、一模一樣的 24/7 直播格式——然後一個都紅不起來。

因為 LoFi Girl 的本質從來不是「動漫女孩」或「chillhop」。那些是它的表層。真正讓它紅起來的 DNA 是另外三件事——而那三件事可以被套到任何題材上。這篇文章要做的事,就是帶你拆解這個 DNA,然後用 Suno 跟 Seedance 2.0 做出你自己版本的 LoFi 長影片。

我會用自己前陣子做的一支〈PIXEL Midnight〉當穿插案例——那是一個 Fashion Lo-Fi 版本,像素風的午夜走秀,跟書桌動漫女孩毫無關係,但抓的是同一套 DNA。文末的完整影片你可以打開聽聽看,當作你自己創作的參考。

CHAPTER 01 / THE DNA

LoFi Girl 真正的 DNA

要做出「同款影片」但不被埋沒,你必須先看懂 LoFi Girl 的內核是什麼。我觀察這個類型好幾年,看過無數失敗的模仿品,整理出三個真正重要的原則——你只要抓住這三個,視覺跟音樂風格可以完全不一樣,但觀眾依然會感覺「這是 LoFi Girl 同款」。

THREE DNA PRINCIPLES / 三個核心原則

01 ─ 不打擾

LoFi Girl 是設計來「不需要你看」的內容。視覺只有微動態、音樂只有耐聽節奏、資訊密度刻意壓到最低。你看一眼覺得在動,移開視線回去工作也毫無罪惡感。

02 ─ 一致的情緒

整支影片從頭到尾維持同一個情緒。不是「畫面要漂亮」、不是「音樂要專業」,而是所有元素都指向同一個感覺。LoFi Girl 的感覺是「一個人安靜地做自己的事」——這個感覺從女孩的姿勢、貓的位置、窗外的夜色、到音樂的節奏,全部對齊。

03 ─ 一個具體的場景

抽象的「chill 音樂」沒有記憶點。LoFi Girl 之所以變成一個品牌,是因為它有一個可以被想像、被命名、被重複回憶的「場景」:一個女孩在讀書、一隻貓在旁邊、窗外是城市夜景。場景就是 LoFi 影片的品牌 logo。

大多數失敗的模仿者都在第三條掉鍊。他們模仿了書桌女孩,但那不是他們的場景——那是 LoFi Girl 的場景。結果畫面看起來像是在致敬,但沒有任何辨識度。

KEY INSIGHT

「LoFi Girl 同款影片的關鍵不是長得像 LoFi Girl。是抓住它的三條 DNA,但用在一個只屬於你的場景上。」

CHAPTER 02 / CONCEPT

先決定
你的氛圍命題

開始寫 prompt、生成素材之前,你要先做一件事:用一句話把你的影片主題講出來。這句話不是「lofi beats to study to」,也不是「chillhop 24/7 radio」——這些太抽象,抓不住情緒。

你要寫的是一句場景化的氛圍命題,結構是「時間 + 地點 + 一個人在做什麼」。例如:

❌ 太抽象

「放鬆的 lofi 音樂頻道」

✓ 夠具體

「凌晨三點,東京地鐵的最後一班車上,一個上班族戴著耳機看窗外。」

✓ 夠具體

「雨天下午,巴黎一家咖啡店的角落,一個插畫家在畫速寫。」

✓ 夠具體(PIXEL Midnight 的命題)

「午夜的時裝週後台,燈光沒關,模特兒正走過伸展台。」

這一句話會同時決定你後面三件事:音樂的情緒(凌晨地鐵是 trip-hop、巴黎咖啡是 nu-jazz、時裝週是 deep house lo-fi)、視覺的色調(夜藍冷色、暖木棕黃、霓虹紫黑)、還有你頻道的品牌 positioning(通勤疲憊系、創作慢活系、時尚酷感系)。這三件事一致,你的影片就有了 LoFi Girl 的 DNA——不是因為長得像,是因為情緒對齊了。

在決定命題的時候有一個實用的檢查法:問自己「這個場景是不是有一個我認識的人會覺得很有共鳴?」如果你寫出來的場景太泛、誰都沒感覺,那就還不夠具體。如果你寫出來的場景讓某個具體的族群(設計師、遠距工作者、夜貓子、通勤族、單親媽媽)會覺得「這就是我」,那就對了。

CHAPTER 03 / MUSIC

Step 1:用 Suno
做出耐聽的音樂主題

音樂這一層的目標很明確:產出 10–15 首風格一致、BPM 相近、可以無縫串接的短曲,後製時把它們剪成一段 1 小時的長 mix。不是一首歌循環 30 次,而是一條流暢的音樂河流。

寫一個有效的 lofi prompt

寫「lofi hip hop」這種抽象指令,Suno 給你的會是它對 lofi 的平均值——聽起來很標準但沒特色。有效的 lofi prompt 要把五個維度都寫進去:風格、情緒、樂器、BPM、場景。

PROMPT TEMPLATE

[風格] + [情緒] + [樂器組合] + [BPM] + [場景描述] + instrumental / no vocals

這五個維度裡,最容易被忽略也最關鍵的是 BPM。Lo-Fi 的甜蜜點落在 70–100 BPM 之間,但你的整支影片要鎖定一個固定的 BPM 區間——不能這首 70、下一首 95,這樣串起來會跳。選一個區間,所有 prompt 都用那個區間,串接起來才會像一條河。

實戰:PIXEL Midnight 的 prompt 套組

拿我自己的〈PIXEL Midnight〉舉例。我的氛圍命題是「午夜時裝週後台」,所以音樂要有走秀的節奏感但又不能太 punchy。我試了四個方向才收斂到三組 prompt,BPM 全部鎖在 95–100 之間:

PROMPT 01 / DEEP HOUSE LO-FI(主打)

deep house, lofi, midnight runway, smooth sub bass, brushed drums, Rhodes piano, saxophone, 100 bpm, sophisticated and moody, no vocals, after hours fashion lounge

PROMPT 02 / FASHION LO-FI(巴黎感)

lofi house, downtempo, fashion runway vibe, warm sub bass, soft four on the floor, vinyl crackle, jazzy chords, muted trumpet, 95 bpm, chill but stylish, no vocals, Parisian cafe meets Paris fashion week, instrumental

PROMPT 03 / NU-JAZZ RUNWAY(高級感)

nu jazz, lofi, upright bass, brushed snare, muted trumpet, Rhodes piano, 95 bpm, fashion editorial mood, sophisticated lounge, no vocals, instrumental

注意一件事:這三組 prompt 雖然敘述不同,但核心元素高度重疊——都有 piano、都有 bass、都有 jazzy 色彩、都在 95–100 BPM。這就是風格一致性。你要讓 Suno 生成 15 首時,它們聽起來像「同一個樂團在同一個晚上錄的不同首歌」,而不是三個樂團各寫一首。

大量生成、嚴格挑選

寫好 prompt 後,用同樣的三組 prompt 各自微調、每組生成 5–7 首。Suno 同一個 prompt 每次生成都會有變化,你要做的是大量生成、嚴格挑選。20 首裡面留 12 首左右,剩下的不是節奏不對就是樂器突兀。

挑選的標準只有一條:把每首歌循環兩次,如果第二次會讓你分心就刪掉。LoFi 的 DNA 第一條是「不打擾」,任何會搶走注意力的元素——突然出現的鼓 fill、太花的 piano solo、太前面的 bass、沒必要的轉折——都不能留。這個篩選過程會花你一個下午,但決定了影片的耐聽度。

SUNO TIP

每組 prompt 一定要加 no vocalsinstrumental,否則 Suno 會自己加人聲進去。LoFi 影片有人聲就毀了。

如果你已經訂閱 Suno Pro,可以把滿意的 demo 餵給 v5.5 的 Custom Models 訓練一個專屬 lofi 模型,之後做同系列會極度一致。關於 v5.5 的完整功能可以看我前幾天寫的 Suno v5.5 拆解文

CHAPTER 04 / VISUAL

Step 2:用 Seedance 2.0
做循環視覺

視覺層是 LoFi 影片最有靈魂的部分,也是最容易做壞的部分。先講最重要的觀念:你要做的不是一段「好看的動畫」,而是一段看起來幾乎沒在動、但一直在動的循環。這兩件事差異很大。

LoFi 視覺的動態元素應該是「微觀」的:飄動的窗簾、上升的煙、飄過的雲、輕微擺動的吊飾、緩慢眨眼的角色、書頁翻動。不應該是鏡頭推軌、角色走路、視角切換這類「電影感」的動作。前者是陪伴,後者是表演——你要做的是前者。

為什麼選 Seedance 2.0

2026 年的 AI 影片工具選擇很多——Veo 3.1、Kling 3.0、Runway Gen-4.5、Pika、Luma 都各有強項。但對 LoFi 循環影片這個特定用途來說,我推薦的是字節跳動在 2 月推出的 Seedance 2.0,原因有三個。

01 ─ 多模態輸入最靈活

Seedance 2.0 一次可以餵進 9 張圖、3 段影片、3 段音訊,用 @image1、@video2 這種標籤直接引用。做 LoFi 循環時你常常需要同時給它角色圖、場景圖、色調參考圖——這種多素材工作流在 Seedance 上最順。

02 ─ 角色一致性穩定

如果你有自己的 VTuber 角色、或想用同一個角色做整個系列,Seedance 用 reference image 鎖角色的能力在目前市面上是最穩的之一。LoFi Girl 的成功很大一部分靠「同一個角色」建立記憶點,這件事 Seedance 能幫你做到。

03 ─ 中文 prompt 比英文準

Seedance 是中國團隊開發,中文 prompt 的理解度比多數國外模型好。對中文創作者來說,這讓描述微妙的動作、情緒、場景變得容易很多。

Seedance 的工作流程

做 LoFi 循環的流程大致是這樣:先準備一張靜態的場景圖(用 Midjourney、Imagen、Nano Banana、或任何你順手的圖像生成工具都可以),然後把這張圖丟進 Seedance 用 image-to-video 模式,prompt 用中文寫,重點放在「微動態」的描述。

SEEDANCE PROMPT 範例

角色坐在桌前畫圖,頭髮輕輕飄動,咖啡杯冒著熱氣。深色房間,窗外城市夜景的霓虹燈緩慢閃爍,柔和光影映在臉上。安靜放鬆的氛圍,緩慢的循環動畫,日系動畫風格。

幾個關鍵撇步:動作盡量只寫一兩個(畫圖 + 頭髮飄動),太多動作容易讓畫面變形。「熱氣」「光影變化」這種微動態很適合 LoFi 慢節奏。上傳的參考圖最好是你想要的姿勢(坐姿側面最穩定),Seedance 會盡量保持原圖構圖。

產出的素材有兩類要分開做。一類是主視覺循環,就是影片 90% 時間會看到的那一幕(LoFi Girl 就是書桌女孩那段);另一類是氛圍鏡頭,像是窗外雲流動、燈光閃爍、桌面細節特寫。主視覺做 1–2 段、氛圍鏡頭做 3–5 段,後製時交錯使用,畫面就不會單調。

LOOP 技巧

Seedance 預設不會幫你做首尾無縫的 loop。最簡單的處理方法是把片段複製一份、反向播放接在後面,變成「A → A 反向」,首尾就會自然銜接。或是在剪輯軟體裡用 1–2 秒的 cross-fade 蓋掉接點。

順帶一提,Seedance 2.0 的完整功能——@ 引用系統、多鏡頭敘事、原生音畫同步——細節太多,一篇塞不下,我近期會另外寫一篇專門的 Seedance 2.0 教學文。想第一時間看到的話可以訂閱 AI 覺醒,新文章發布會通知你。

AI 覺醒設計應用攻略
即將發布✨ 訂閱收通知

Seedance 2.0 完整教學近期上線

@ 引用系統、多鏡頭敘事、中文 prompt 進階技巧、避免角色崩壞的方法——訂閱 AI 覺醒,發布時第一時間收到通知。

AI 工具實測與工作流分享

設計師角度的 Prompt 技巧

每週精選 AI × 設計新知

CHAPTER 05 / EDITING

Step 3:剪輯邏輯

這是整個流程裡最不華麗但最關鍵的一步。Suno 一首歌大概 2–3 分鐘、Seedance 一段影片 5–10 秒,要把這些短素材變成一支耐看的 1 小時影片,剪輯邏輯比你想像的重要。軟體用 CapCut、剪映、Premiere、DaVinci Resolve 都可以——工具不重要,邏輯才重要。

音樂的串接:crossfade 是祕密武器

把 12 首挑選後的歌曲依序排在音軌上,每首歌之間做 2–4 秒的 crossfade(交叉淡化)。這是 LoFi 長影片的祕密武器——crossfade 做對,聽眾完全感覺不到歌曲在切換,整個 1 小時聽起來會像一首沒結束的長 mix。

crossfade 的長度要根據音樂的節奏感調整。BPM 接近的(這就是為什麼前面要鎖 BPM 區間),3 秒 crossfade 就夠了。BPM 差距大的就要拉到 4–5 秒甚至更長,讓鼓點有時間融合。如果你不確定該用幾秒,從 3 秒開始試,不夠順就加。

視覺的循環:交錯素材避免單調

把 Seedance 產出的主視覺循環跟氛圍鏡頭交錯擺放,每段大概 30 秒到 1 分鐘換一次畫面。重點不是「畫面要花俏」,而是「畫面要剛好有變化但不打擾人」。LoFi Girl 的動畫之所以紅,就是因為它做到了這個微妙平衡——你看一眼覺得「喔在動」,但你移開視線回去工作也毫無罪惡感。

最後加上三個小細節,整支影片的 LoFi 質感會直接拉滿:

1

左下或右上放品牌字樣(頻道名稱 + 系列名稱,字體要小、不搶戲)。

2

疊一層輕微的 film grain 顆粒(不透明度 10–15% 就好),這是 LoFi 視覺的靈魂。

3

加一層淡淡的 vignette 把畫面四角壓暗一點,引導視線集中到中央。

CHAPTER 06 / UPLOAD

上架 YouTube 的
SEO 與封面策略

影片做完不代表結束。LoFi 影片的演算法是一種很特別的存在——它不靠爆發式流量,靠的是「被加入播放清單之後能一直被播」。所以上傳階段的三件事會決定你能不能被演算法找到:標題、縮圖、描述。

標題公式:場景 + 類型 + 時長

LoFi 類型的 YouTube 標題有一個已經驗證過的公式:「[情緒動詞 + 場景] - [時長] of [音樂類型]」。例如:

beats to study/relax to - 1 hour of chill lofi hip hop

late night tokyo drive - 2 hours of trip hop radio

rainy cafe afternoon - 3 hours of jazz lofi mix

(PIXEL Midnight 的實際標題)beats to design/work to — 1 hour of catwalk fashion runway radio

這個公式之所以有效,是因為它同時給 YouTube 演算法跟人類觀眾兩個訊號:場景讓人類覺得「這跟我現在的心情合」,類型讓演算法知道該把你推給誰。兩邊都照顧到,才會被準確送到對的人面前。

縮圖:一眼辨識的情緒

LoFi 影片的縮圖跟一般 YouTube 影片縮圖的邏輯完全相反。一般影片要誇張、要有大字、要有箭頭紅圈;LoFi 影片要安靜、有氛圍、零文字或極少文字。因為觀眾滑到 LoFi 類型縮圖時要的是「視覺休息」,不是「點擊刺激」。

最理想的做法是直接用你影片裡最漂亮的一幀當縮圖,頂多在角落加一個小小的頻道字樣。整個縮圖的情緒要跟標題對齊——標題講「凌晨東京」,縮圖就不能是陽光沙灘。這聽起來很廢話,但你去看 YouTube 就會發現一堆新手的標題跟縮圖的情緒完全對不上。

CHAPTER 07 / PITFALLS

新手最常踩的
五個坑

01 ─ 直接抄 LoFi Girl 的書桌女孩

你抄出來的只會是搜尋結果第二頁。找你自己的場景,這是唯一讓你被看見的方法。

02 ─ 音樂風格不統一

BPM 跳來跳去、樂器組合每首都不一樣、情緒時快時慢。聽眾放三分鐘就會關掉。鎖定 BPM 區間、鎖定樂器主軸,是耐聽的基礎。

03 ─ 視覺太花

角色做太多動作、鏡頭一直切換、背景一直變。記住:你要做的是陪伴,不是表演。

04 ─ 沒做 crossfade 就上傳

歌跟歌之間硬接,聽眾每三分鐘就會感覺被打斷一次。這件事不做,前面所有的努力都會被稀釋掉。

05 ─ 沒有版權意識就商業使用

Suno 的商用權利需要訂閱 Pro 以上方案才有,Seedance 的輸出內容也有各自的授權條款。如果你要經營頻道、開廣告、接業配,上傳前一定要確認每個工具的商業授權範圍。

CHAPTER 08 / TAKEAWAY

重點整理

SUMMARY / 一分鐘懶人包

LoFi Girl 的 DNA 是三條:不打擾、一致的情緒、具體的場景。抓住這三條,視覺跟音樂可以完全不同但依然有 LoFi 感。

開始做之前先寫一句場景化的氛圍命題(時間 + 地點 + 一個人在做什麼),這句話會決定後續所有創作決策。

Suno 的 prompt 要寫滿五個維度:風格、情緒、樂器、BPM、場景。BPM 一定要鎖區間,整個影片風格才一致。

大量生成、嚴格挑選。20 首留 12 首,標準是「循環兩次不會讓你分心」。

Seedance 2.0 做循環視覺,中文 prompt、微動態描述、分主視覺跟氛圍鏡頭兩類。用反向播放或 crossfade 處理首尾接點。

剪輯的關鍵是音樂 crossfade(2–4 秒)跟視覺素材交錯(30 秒–1 分鐘換一次)。加 film grain 跟 vignette 拉質感。

YouTube 標題用「場景 + 時長 + 類型」公式,縮圖要安靜有氛圍、零或極少文字。

如果你想再聽一次〈PIXEL Midnight〉當作氛圍命題的參考,影片就在文章最上面。這篇文章講的每一個原則,都能在那支影片裡找到對應——氛圍命題是「午夜時裝週後台」、音樂 BPM 鎖 95–100、視覺走像素風微動態、剪輯用 crossfade + grain + vignette。你可以把它當成一個具體的範本,然後做出屬於你的版本。

我的 YouTube 頻道上還有其他幾支不同主題的 LoFi 實驗作品,如果你想看我怎麼把這套方法論套在不同氛圍命題上,可以點圖片過去逛逛:

設計師 Riven 的 YouTube 頻道 — 點擊前往

▲ 點圖片前往「設計師 Riven」YouTube 頻道

LoFi Girl 的成功不能被複製,但它的 DNA 可以。
你的場景,是你一個人的 LoFi Girl。

AI 覺醒設計應用攻略
訂閱制✨ AI × 設計趨勢

AI 覺醒設計應用攻略

AI 工具每週都在更新,我幫你過濾雜訊,只整理對設計師真正有用的 AI 應用。Seedance 2.0 完整教學近期發布。

AI 工具實測與工作流分享

設計師角度的 Prompt 技巧

每週精選 AI × 設計新知

文章標籤

# Suno