Karpathy 為什麼加入 Anthropic?OpenAI 創始成員轉投 Claude 陣營的完整訊號解讀
AI INDUSTRY · MAY 2026
QUICK ANSWER
是真的。2026 年 5 月 19 日美西時間,Andrej Karpathy 在 X 親自宣布加入 Anthropic,這週已經正式上工。他不是去做模型 demo,也不是去當顧問,而是直接進 Pretraining team,帶一個新組做一件很具體的事:用 Claude 加速 Claude 自己的 pre-training 研究。簡單說,讓 AI 訓練下一代 AI。
CHAPTER 01 · WHAT HAPPENED
他自己發的,一段話而已
台灣時間昨天晚上 10 點多,Karpathy 在 X 上發了一段話:
@KARPATHY · MAY 19, 2026
Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.
沒有大張旗鼓的官網公告,沒有訪談,就一段五句話的個人 update。但這段話發出來不到一小時,TechCrunch、VentureBeat、Axios、CNBC、Fortune 全部跟上,矽谷半個科技圈都在轉。
Anthropic 的 Pretraining 負責人 Nick Joseph(前 OpenAI)隨即在 X 上接話:「歡迎 Andrej 加入 Pretraining team,他要帶一個專門用 Claude 加速 pretraining 研究本身的組。我想不到比他更適合的人。」官方發言人也跟 TechCrunch、VentureBeat、Bitcoin World 同步證實了這個角色。
這場轉職的訊號比新聞本身大。我接下來想拆三件事:Karpathy 到底是誰、他在 Anthropic 要幹嘛、為什麼這件事對非 AI 從業者(包括你我這種設計師、創作者)也很重要。
CHAPTER 02 · WHO IS HE
最會把 LLM 講清楚的那個人
先把人講清楚。Karpathy 39 歲,斯洛伐克裔加拿大人,Stanford PhD 出身,指導教授是 Fei-Fei Li,2015 年是 OpenAI 創始 11 人之一。學歷、輩分、戰績這些東西在 AI 圈裡多的是,但有兩件事讓他特別。
第一,他在 Stanford 念博士期間設計並開了 CS 231n,Stanford 第一門深度學習課。從 2015 年 150 個學生,到 2017 年衝到 750 人。那是 AI 還沒紅之前。等到後來 Transformer、GPT、ChatGPT 一路引爆,這門課的網路教材變成全球工程師自學 AI 的標準入口。
第二,他真的會「把難的東西講簡單」。他在 YouTube 上的免費課《Neural Networks: Zero to Hero》,教你從一行 Python 寫一個神經網路,一路寫到 GPT。中間的影片動輒兩三小時,沒有人說不無聊,但全 GitHub 工程師都在追。今年 2 月他放的另一支《How I use LLMs》,短短三個月,觀看數已經破 240 萬。
KARPATHY · CAREER TIMELINE
2015
OpenAI 創始
創始 11 人之一
2017
Tesla AI 主管
領導 Autopilot 與 FSD 視覺團隊
2023
重返 OpenAI
建 midtraining 與合成資料團隊
2024
Eureka Labs
創立 AI 教育新創
2026
加入 Anthropic
Pretraining team,帶用 Claude 訓 Claude 的新組
他這幾年發明的概念也很有意思。最有名的是「vibe coding」——用自然語言講需求,讓 AI 寫程式,你只看結果,不細究 code 的細節。這個詞現在被矽谷整個拿去用。對工程師有點冒犯,但對設計師、PM、創作者很實用,因為這正是我們真正會用 AI 的方式。
他在 AI 領域裡是少數把「研究員」「工程師」「老師」三個身分都做到頂的人。研究員的底子讓他能進 Anthropic 前線,老師的角色讓他全網都認識。這次轉職放到他自己的脈絡裡看,不算意外,但時間點挑得很準。
CHAPTER 03 · THE NEW ROLE
用 Claude 訓練 Claude,這是一個賭注
Karpathy 這次加入的不是業務、不是傳教、不是品牌。他直接進 Pretraining team,直屬 Nick Joseph。Pretraining 在大型語言模型裡是最底層、最貴、也最關鍵的階段——所有 Claude 的「腦袋裡有什麼」就是 pretraining 決定的。你之後做 RLHF、做 fine-tune、做 agent,都只是在這個底子上修。
而 Anthropic 給他的任務具體得不能再具體:帶一個新組,研究怎麼用 Claude 自己加速 pre-training 研究。
這句話可以兩層讀。
TWO LAYERS
01
表層:省人省錢
用 AI 跑實驗、寫訓練 code、做超參數搜尋、自動分析 loss 曲線。研究員從每天看 100 個圖表變成看 10 個摘要,節奏直接快十倍。
02
深層:模型開始自己改自己
讓 Claude 提出新架構、新資料配方、新訓練策略,再丟下一輪 pretraining 跑驗證。這是 AI 研發循環從「人去想、機器去算」轉成「人定方向、AI 想方法、機器去算」的關鍵一步。
為什麼 Anthropic 這時候做這件事?因為 LLM 的研發成本,已經到了「光是堆算力不可能贏」的階段。GPT-4 級別的訓練,單次成本上看一億美元。誰能用更少算力跑出更好結果,誰就贏下一輪。Karpathy 這次帶的,就是這個下半場的核心議題。
Nick Joseph 在公開貼文裡說「想不到比他更適合的人」——這不是客套,Karpathy 在 OpenAI 第二段(2023 到 2024 年)做的就是 midtraining 與合成資料生成,這兩個議題剛好就是「用 AI 訓 AI」的前哨。
CHAPTER 04 · WHY IT MATTERS
這場挖角不是孤立事件
Karpathy 加入 Anthropic 的同一天,Anthropic 也宣布資深資安研究員 Chris Rohlf 加入 frontier red team。再往前推兩週,xAI 創始成員 Ross Nordeen 也跳到 Anthropic。同一個月,Anthropic 還跟 SpaceX 簽了 Colossus 1 算力合約,直接租 xAI 自己蓋的資料中心。
這不是巧合,是一連串攻勢。
有人從 OpenAI 來、有人從 xAI 來、有人從 Meta 來,Anthropic 在這個時間點變成 AI 圈最熱的中轉站。這背後有幾層脈絡。
第一層,OpenAI 的人才結構在鬆動。Anthropic 本來就是 OpenAI 出走的人創立的——Dario 跟 Daniela Amodei、十幾個前 OpenAI 研究員。現在再加一個創始 11 人裡的成員,這個訊號在內部跟外部都不算輕。
第二層,Anthropic 在做戰略下注。Karpathy 不會只是來寫 paper。他帶的組要做的「用 AI 加速 AI 研發」,是接下來這幾年判輸贏的核心題。Anthropic 押了重金請他來主導這條線——選他,比押算力便宜,但風險更高、報酬也更高。
第三層,Karpathy 自己的選擇。他把 Eureka Labs 暫停,這件事意義不小。他 2024 年離開 OpenAI 就是為了做 AI 教育,一年半之後願意按下暫停鍵回去做 LLM 前線研究,只代表一件事:他覺得接下來這兩三年模型還會跳一個階段,他不想錯過。他自己在那段 X update 裡寫的就是 “the next few years at the frontier of LLMs will be especially formative”——formative 這個字選得很重,意思是定型期。
"
當教育的工作可以晚兩年做,但前線的窗口只有現在,就回前線。這是一個對自己誠實的人會做的選擇。
CHAPTER 05 · FOR DESIGNERS & CREATORS
設計師、創作者為什麼該關心這件事
講白一點。Karpathy 加入 Anthropic 對非 AI 研究者來說,有兩個面向是直接相關的。
第一,Claude 接下來會更聰明。不是「更會回答問題」那種抽象的聰明,是「同樣的時間、同樣的 prompt、給出更接近你想要的東西」的那種聰明。如果用 Claude 加速 pretraining 真的做出來,Anthropic 的迭代週期會縮短。新版 Claude 之間的差距會變大,Claude 跟對手之間的差距也會變大。對我們這種把 AI 當第二個腦袋來用的人,這是直接受益。
第二,Karpathy 是少數會教非工程師看懂 LLM 的人。他 2 月發的《How I use LLMs》,那 2 小時 7 分鐘其實就是一份「AI 工具使用者手冊」,對設計師、創作者特別有用。他講怎麼選模型、怎麼用 thinking mode、怎麼讓 Claude 跑 Artifacts、怎麼用 NotebookLM——這些都是我這幾個月在 AI 覺醒設計應用攻略訂閱方案裡反覆在講的東西。他比我講得清楚,而且免費。
我貼一下這支影片,沒看過的真心建議找個下午配咖啡看完——
▲ Andrej Karpathy《How I use LLMs》,2025/02 發布,觀看數已破 240 萬。提到 Claude Artifacts 的段落在 1:09:00 開始。
看完這支影片你會發現一件很微妙的事:Karpathy 自己每天用最多的工具裡,Claude 一直在第一線。他在影片裡示範 Claude Artifacts 怎麼即時生成可互動的小工具、示範怎麼用 Claude 處理多檔案上下文。換句話說,他在加入 Anthropic 之前,就已經是這家公司最有說服力的代言人——只是當時還沒掛在他名片上。
你可以把這次轉職看成兩件事的合流:Anthropic 找到了它最會講話、最被信任的研究員,Karpathy 找到了能讓他的 vibe coding 哲學跑得最遠的引擎。對 Claude 用戶來說,這是個雙贏的訊號。
TAKEAWAYS
→
Karpathy 加入的不是「研究員身份」,是一個帶新組、做「用 Claude 訓 Claude」這件具體事的角色。AI 圈下半場的核心題目就是這件事。
→
同月 Anthropic 連挖 OpenAI、xAI、Meta 三家的關鍵人,再加上跟 SpaceX 簽 Colossus 1 算力合約。這是一場有節奏的攻勢。
→
對設計師、創作者最直接的影響是:Claude 接下來會迭代得更快,且 Karpathy 那支《How I use LLMs》就是設計師用 LLM 的最強免費入門。配咖啡看一個下午,比 90% 的付費課程划算。
→
Eureka Labs 暫停這件事最值得記:當一個人願意把自己創的公司按下暫停鍵去做別人公司的研究,那個「別人公司」一定有他覺得不能錯過的東西。
FAQ
常見問題
Q:Karpathy 真的加入 Anthropic 了嗎?
是的。2026 年 5 月 19 日他親自在 X 上宣布,Anthropic 也透過 Nick Joseph 的官方貼文與 TechCrunch、VentureBeat、Axios、CNBC、Fortune 等媒體的官方發言人證實。他這週已經正式上工。
Q:他在 Anthropic 做什麼?
加入 Pretraining team,直屬團隊負責人 Nick Joseph。他會帶一個新組,主題是「用 Claude 加速 Claude 的 pre-training 研究」,簡單講就是讓 AI 協助研究下一代 AI 的訓練方式。
Q:Eureka Labs 怎麼辦?
暫停。他在 X 上的原話是「我依然對教育有熱情,會在未來重啟相關工作」,意思就是現在按下暫停鍵。Eureka Labs 過去這一年本來就沒什麼公開更新,這次算是正式擱置。
Q:這對 Claude 用戶有什麼影響?
中長期會有。如果 Karpathy 帶的組真的做出「用 Claude 加速 pretraining」這件事,Anthropic 的模型迭代速度會明顯拉快,Claude 與其他競品的差距會擴大。短期看不到劇變,但 6 到 12 個月後可能會明顯感覺到 Claude 更新節奏不同。
Q:設計師可以從哪裡開始了解 Karpathy 的東西?
最推薦兩支影片:《How I use LLMs》是給一般使用者的,偏實戰應用,設計師、創作者、PM 都看得懂;《Deep Dive into LLMs like ChatGPT》偏技術原理,適合想理解模型內部怎麼跑的人。兩支都免費,在他自己的 YouTube 頻道。






