Claude Sonnet 4.6 完整介紹：Opus 級效能、1/5 價格，免費版也能用

Anthropic 兩週內第二次重磅發布，AI 程式碼助手與電腦操作能力再創新高

2026 年 2 月 17 日，Anthropic 發布了 Claude Sonnet 4.6——距離 Opus 4.6 發布僅 12 天。這不是漸進式更新，而是一次顛覆性的躍進：中階模型首次達到旗艦級效能，而價格僅為 Opus 的五分之一。

更令人振奮的是，Sonnet 4.6 現已成為免費版和 Pro 版的預設模型，並新增檔案創建、connectors、skills 等功能。對於設計師、開發者和內容創作者來說，這意味著頂級 AI 能力不再是付費牆後的奢侈品。

79.6%

SWE-bench 程式碼

72.5%

OSWorld 電腦操作

Token 上下文窗口

/百萬輸入 token

六大核心亮點

🧠

Adaptive Thinking 引擎

全新的思考模式，模型會「暫停」並在回答前進行內部推理。透過 effort 參數動態調整推理深度，平衡速度、成本與智慧。

📄

1M Token 上下文窗口

Beta 版本提供百萬 token 上下文，是 Sonnet 4.5 的兩倍。可容納整個程式碼庫、長篇合約或數十篇研究論文。

💻

電腦操作能力躍進

OSWorld 從 14.9%（2024/10）躍升至 72.5%。能像人類一樣操作瀏覽器、填表單、處理試算表。

🛡️

Prompt Injection 防禦

對惡意網站隱藏指令的抵抗力大幅提升，瀏覽器自動化更安全可靠。

🔧

程式碼能力大幅提升

70% 開發者偏好 Sonnet 4.6 勝過 4.5，甚至 59% 偏好它勝過 Opus 4.5。更少過度設計、更少偷懶。

🆓

免費版同步升級

免費用戶現在預設使用 Sonnet 4.6，並新增檔案創建、connectors、skills、compaction 功能！

"過去需要 Opus 級別模型才能完成的工作——包括真實世界中具有經濟價值的辦公任務——現在 Sonnet 4.6 就能做到。"
— Anthropic 官方公告

Benchmark 完整數據

Sonnet 4.6 在多項基準測試中逼近甚至追平 Opus 4.6，而價格只有五分之一。以下是關鍵數據比較：

Claude Sonnet 4.6 Benchmark 比較表 — Claude Sonnet 4.6 與其他模型的 Benchmark 比較｜圖片來源：Anthropic 官方

Benchmark	Sonnet 4.6	Opus 4.6	Sonnet 4.5	GPT-5.2
SWE-bench Verified (程式碼)	79.6%	80.8%	77.2%	—
OSWorld-Verified (電腦操作)	72.5%	72.7%	61.4%	38.2%
ARC-AGI-2 (人類智慧)	60.4%	更高	—	較低
開發者偏好度 vs Sonnet 4.5	70%	—	30%	—

📈 電腦操作能力的驚人進步

16 個月內，Anthropic 的電腦操作分數幾乎翻了五倍：

Claude OSWorld Benchmark 進步圖表 — Claude 在 OSWorld benchmark 的進步曲線（16 個月內從 14.9% 躍升至 72.5%）｜圖片來源：Anthropic 官方

2024 年 10 月 · Claude Sonnet 3.5

OSWorld: 14.9%

2025 年 · Claude Sonnet 4.5

OSWorld-Verified: 61.4%

2026 年 2 月 · Claude Sonnet 4.6

OSWorld-Verified: 72.5% ⬆️

定價與方案比較

Sonnet 4.6 維持與 Sonnet 4.5 相同的定價，但效能大幅提升。對於每天進行數百萬次 API 呼叫的企業來說，這個價差不是漸進式的，而是革命性的。

項目	Sonnet 4.6 ⭐	Opus 4.6
輸入價格	$3 / 百萬 token	$15 / 百萬 token
輸出價格	$15 / 百萬 token	$75 / 百萬 token
上下文窗口	1M tokens (beta)	1M tokens
知識截止日期	2025 年 8 月	2025 年 8 月
價格差距	基準	5 倍貴

💰 成本計算範例：假設每天 100 萬次 API 呼叫，每次 1000 token 輸入 + 500 token 輸出。使用 Sonnet 4.6 月費約 $1,350，Opus 4.6 則需 $6,750。年省 $64,800！

企業實測評價

多家企業在早期測試中給出了驚人的評價：

"Claude Sonnet 4.6 在我們的保險 benchmark 達到 94%，是所有 Claude 模型中最高的。它能推理失敗原因並自我修正，這是我們前所未見的。"

— Jamie Cuffe, CEO of Pace

"Box 測試發現 Sonnet 4.6 在深度推理 Q&A 上比 Sonnet 4.5 高出 15 個百分點，從 62% 提升到 77%。"

— Box 企業測試報告

"Sonnet 4.6 在 OfficeQA 上追平 Opus 4.6，能讀取企業文件（圖表、PDF、表格）、提取正確事實並進行推理。這對文件理解工作流是重大升級。"

— Hanling Tang, CTO of Neural Networks at Databricks

"Sonnet 4.6 在我們的電腦操作評估中產生零個幻覺連結。之前大約三分之一的連結是幻覺。這種可靠性才能讓瀏覽器自動化真正上線。"

— 企業用戶評測

📊 產業特定表現

94%

零售業務

88%

公部門

78%

醫療保健

如何開始使用

🌐 Claude.ai（免費/Pro）

Sonnet 4.6 已是預設模型，直接使用即可。免費版新增功能：

檔案創建（File Creation）
Connectors 整合
Skills 技能
Compaction 長對話壓縮

💻 API 存取

model: "claude-sonnet-4-6-20260217"

☁️ 雲端平台

Amazon Bedrock：已上線
Google Cloud Vertex AI：已上線
Claude Cowork：預設模型
Claude Code：支援

💡 遷移提示：從 Sonnet 4.5 遷移只需少量 prompt 調整。Anthropic 表示相容性很高。

該選 Sonnet 還是 Opus？

這是很多人的疑問。以下是簡單的決策指南：

✅ 選 Sonnet 4.6

大量 API 呼叫、成本敏感
日常程式碼工作
電腦操作 / 瀏覽器自動化
文件分析、知識工作
大多數商業應用

🔷 選 Opus 4.6

深度科學推理
最高可靠性需求
複雜多學科任務
Agentic coding 長時間運行
預算充足、追求極致

"對大多數開發者來說，Sonnet 4.6 現在是預設選擇。Opus 4.6 仍在深度科學推理和最高可靠性場景中佔優，但五倍的價格讓它的適用場景更窄了。"
— NxCode 分析

安全性評估

Anthropic 的安全研究團隊對 Sonnet 4.6 進行了全面評估，結論是：

"Sonnet 4.6 具有溫暖、誠實、利社會，有時還很幽默的特質，擁有非常強的安全行為，且沒有高風險錯位的重大隱憂。"

整體而言，Sonnet 4.6 的安全性與其他近期 Claude 模型相當或更優。

結語：中階模型的分水嶺

Claude Sonnet 4.6 的發布標誌著一個轉捩點：「中階」與「旗艦」的界線正在消失。當中階模型在程式碼和電腦操作上追平旗艦，而價格只有五分之一時，整個產業的成本結構都將被重新定義。

對於設計師和創作者來說，這意味著頂級 AI 能力變得更加觸手可及。無論你是用它來寫程式碼、分析資料、還是自動化重複性工作，Sonnet 4.6 都是 2026 年最值得嘗試的 AI 模型之一。

ClaudeSonnet 4.6AnthropicAI 模型2026

AI 覺醒設計應用攻略

🚀 AI 覺醒設計應用攻略

將 AI 變成你的設計外掛：網頁、繪畫、動畫、影片

一套工作流、一台電腦、一人全開通｜NT$399 / 月

立即訂閱 → 瞭解方案