
Anthropic 兩週內第二次重磅發布,AI 程式碼助手與電腦操作能力再創新高
2026 年 2 月 17 日,Anthropic 發布了 Claude Sonnet 4.6——距離 Opus 4.6 發布僅 12 天。這不是漸進式更新,而是一次顛覆性的躍進:中階模型首次達到旗艦級效能,而價格僅為 Opus 的五分之一。
更令人振奮的是,Sonnet 4.6 現已成為免費版和 Pro 版的預設模型,並新增檔案創建、connectors、skills 等功能。對於設計師、開發者和內容創作者來說,這意味著頂級 AI 能力不再是付費牆後的奢侈品。
六大核心亮點
Adaptive Thinking 引擎
全新的思考模式,模型會「暫停」並在回答前進行內部推理。透過 effort 參數動態調整推理深度,平衡速度、成本與智慧。
1M Token 上下文窗口
Beta 版本提供百萬 token 上下文,是 Sonnet 4.5 的兩倍。可容納整個程式碼庫、長篇合約或數十篇研究論文。
電腦操作能力躍進
OSWorld 從 14.9%(2024/10)躍升至 72.5%。能像人類一樣操作瀏覽器、填表單、處理試算表。
Prompt Injection 防禦
對惡意網站隱藏指令的抵抗力大幅提升,瀏覽器自動化更安全可靠。
程式碼能力大幅提升
70% 開發者偏好 Sonnet 4.6 勝過 4.5,甚至 59% 偏好它勝過 Opus 4.5。更少過度設計、更少偷懶。
免費版同步升級
免費用戶現在預設使用 Sonnet 4.6,並新增檔案創建、connectors、skills、compaction 功能!
"過去需要 Opus 級別模型才能完成的工作——包括真實世界中具有經濟價值的辦公任務——現在 Sonnet 4.6 就能做到。"
— Anthropic 官方公告
Benchmark 完整數據
Sonnet 4.6 在多項基準測試中逼近甚至追平 Opus 4.6,而價格只有五分之一。以下是關鍵數據比較:

📈 電腦操作能力的驚人進步
16 個月內,Anthropic 的電腦操作分數幾乎翻了五倍:

2024 年 10 月 · Claude Sonnet 3.5
OSWorld: 14.9%
2025 年 · Claude Sonnet 4.5
OSWorld-Verified: 61.4%
2026 年 2 月 · Claude Sonnet 4.6
OSWorld-Verified: 72.5% ⬆️
定價與方案比較
Sonnet 4.6 維持與 Sonnet 4.5 相同的定價,但效能大幅提升。對於每天進行數百萬次 API 呼叫的企業來說,這個價差不是漸進式的,而是革命性的。
企業實測評價
多家企業在早期測試中給出了驚人的評價:
"Claude Sonnet 4.6 在我們的保險 benchmark 達到 94%,是所有 Claude 模型中最高的。它能推理失敗原因並自我修正,這是我們前所未見的。"
— Jamie Cuffe, CEO of Pace
"Box 測試發現 Sonnet 4.6 在深度推理 Q&A 上比 Sonnet 4.5 高出 15 個百分點,從 62% 提升到 77%。"
— Box 企業測試報告
"Sonnet 4.6 在 OfficeQA 上追平 Opus 4.6,能讀取企業文件(圖表、PDF、表格)、提取正確事實並進行推理。這對文件理解工作流是重大升級。"
— Hanling Tang, CTO of Neural Networks at Databricks
"Sonnet 4.6 在我們的電腦操作評估中產生零個幻覺連結。之前大約三分之一的連結是幻覺。這種可靠性才能讓瀏覽器自動化真正上線。"
— 企業用戶評測
📊 產業特定表現
如何開始使用
🌐 Claude.ai(免費/Pro)
Sonnet 4.6 已是預設模型,直接使用即可。免費版新增功能:
- 檔案創建(File Creation)
- Connectors 整合
- Skills 技能
- Compaction 長對話壓縮
💻 API 存取
☁️ 雲端平台
- Amazon Bedrock:已上線
- Google Cloud Vertex AI:已上線
- Claude Cowork:預設模型
- Claude Code:支援
該選 Sonnet 還是 Opus?
這是很多人的疑問。以下是簡單的決策指南:
✅ 選 Sonnet 4.6
- 大量 API 呼叫、成本敏感
- 日常程式碼工作
- 電腦操作 / 瀏覽器自動化
- 文件分析、知識工作
- 大多數商業應用
🔷 選 Opus 4.6
- 深度科學推理
- 最高可靠性需求
- 複雜多學科任務
- Agentic coding 長時間運行
- 預算充足、追求極致
"對大多數開發者來說,Sonnet 4.6 現在是預設選擇。Opus 4.6 仍在深度科學推理和最高可靠性場景中佔優,但五倍的價格讓它的適用場景更窄了。"
— NxCode 分析
安全性評估
Anthropic 的安全研究團隊對 Sonnet 4.6 進行了全面評估,結論是:
"Sonnet 4.6 具有溫暖、誠實、利社會,有時還很幽默的特質,擁有非常強的安全行為,且沒有高風險錯位的重大隱憂。"
整體而言,Sonnet 4.6 的安全性與其他近期 Claude 模型相當或更優。
結語:中階模型的分水嶺
Claude Sonnet 4.6 的發布標誌著一個轉捩點:「中階」與「旗艦」的界線正在消失。當中階模型在程式碼和電腦操作上追平旗艦,而價格只有五分之一時,整個產業的成本結構都將被重新定義。
對於設計師和創作者來說,這意味著頂級 AI 能力變得更加觸手可及。無論你是用它來寫程式碼、分析資料、還是自動化重複性工作,Sonnet 4.6 都是 2026 年最值得嘗試的 AI 模型之一。


