Claude Sonnet 4.6 完整介紹:Opus 級效能、1/5 價格,免費版也能用

Anthropic 兩週內第二次重磅發布,AI 程式碼助手與電腦操作能力再創新高
設計師 Riven

設計師 Riven

2026年2月18日 下午 2:51

AI 設計

Anthropic 兩週內第二次重磅發布,AI 程式碼助手與電腦操作能力再創新高

2026 年 2 月 17 日,Anthropic 發布了 Claude Sonnet 4.6——距離 Opus 4.6 發布僅 12 天。這不是漸進式更新,而是一次顛覆性的躍進:中階模型首次達到旗艦級效能,而價格僅為 Opus 的五分之一

更令人振奮的是,Sonnet 4.6 現已成為免費版和 Pro 版的預設模型,並新增檔案創建、connectors、skills 等功能。對於設計師、開發者和內容創作者來說,這意味著頂級 AI 能力不再是付費牆後的奢侈品。

79.6%
SWE-bench 程式碼
72.5%
OSWorld 電腦操作
1M
Token 上下文窗口
$3
/百萬輸入 token

六大核心亮點

🧠

Adaptive Thinking 引擎

全新的思考模式,模型會「暫停」並在回答前進行內部推理。透過 effort 參數動態調整推理深度,平衡速度、成本與智慧。

📄

1M Token 上下文窗口

Beta 版本提供百萬 token 上下文,是 Sonnet 4.5 的兩倍。可容納整個程式碼庫、長篇合約或數十篇研究論文。

💻

電腦操作能力躍進

OSWorld 從 14.9%(2024/10)躍升至 72.5%。能像人類一樣操作瀏覽器、填表單、處理試算表。

🛡️

Prompt Injection 防禦

對惡意網站隱藏指令的抵抗力大幅提升,瀏覽器自動化更安全可靠。

🔧

程式碼能力大幅提升

70% 開發者偏好 Sonnet 4.6 勝過 4.5,甚至 59% 偏好它勝過 Opus 4.5。更少過度設計、更少偷懶。

🆓

免費版同步升級

免費用戶現在預設使用 Sonnet 4.6,並新增檔案創建、connectors、skills、compaction 功能!

"過去需要 Opus 級別模型才能完成的工作——包括真實世界中具有經濟價值的辦公任務——現在 Sonnet 4.6 就能做到。"

— Anthropic 官方公告

Benchmark 完整數據

Sonnet 4.6 在多項基準測試中逼近甚至追平 Opus 4.6,而價格只有五分之一。以下是關鍵數據比較:

Claude Sonnet 4.6 Benchmark 比較表

Claude Sonnet 4.6 與其他模型的 Benchmark 比較 | 圖片來源:Anthropic 官方
BenchmarkSonnet 4.6Opus 4.6Sonnet 4.5GPT-5.2
SWE-bench Verified (程式碼)79.6%80.8%77.2%
OSWorld-Verified (電腦操作)72.5%72.7%61.4%38.2%
ARC-AGI-2 (人類智慧)60.4%更高較低
開發者偏好度 vs Sonnet 4.570%30%

📈 電腦操作能力的驚人進步

16 個月內,Anthropic 的電腦操作分數幾乎翻了五倍

Claude OSWorld Benchmark 進步圖表

Claude 在 OSWorld benchmark 的進步曲線(16 個月內從 14.9% 躍升至 72.5%)| 圖片來源:Anthropic 官方
1

2024 年 10 月 · Claude Sonnet 3.5

OSWorld: 14.9%

2

2025 年 · Claude Sonnet 4.5

OSWorld-Verified: 61.4%

3

2026 年 2 月 · Claude Sonnet 4.6

OSWorld-Verified: 72.5% ⬆️

定價與方案比較

Sonnet 4.6 維持與 Sonnet 4.5 相同的定價,但效能大幅提升。對於每天進行數百萬次 API 呼叫的企業來說,這個價差不是漸進式的,而是革命性的

項目Sonnet 4.6 ⭐Opus 4.6
輸入價格$3 / 百萬 token$15 / 百萬 token
輸出價格$15 / 百萬 token$75 / 百萬 token
上下文窗口1M tokens (beta)1M tokens
知識截止日期2025 年 8 月2025 年 8 月
價格差距基準5 倍貴
💰 成本計算範例:假設每天 100 萬次 API 呼叫,每次 1000 token 輸入 + 500 token 輸出。使用 Sonnet 4.6 月費約 $1,350,Opus 4.6 則需 $6,750。年省 $64,800!

企業實測評價

多家企業在早期測試中給出了驚人的評價:

"Claude Sonnet 4.6 在我們的保險 benchmark 達到 94%,是所有 Claude 模型中最高的。它能推理失敗原因並自我修正,這是我們前所未見的。"

— Jamie Cuffe, CEO of Pace

"Box 測試發現 Sonnet 4.6 在深度推理 Q&A 上比 Sonnet 4.5 高出 15 個百分點,從 62% 提升到 77%。"

— Box 企業測試報告

"Sonnet 4.6 在 OfficeQA 上追平 Opus 4.6,能讀取企業文件(圖表、PDF、表格)、提取正確事實並進行推理。這對文件理解工作流是重大升級。"

— Hanling Tang, CTO of Neural Networks at Databricks

"Sonnet 4.6 在我們的電腦操作評估中產生零個幻覺連結。之前大約三分之一的連結是幻覺。這種可靠性才能讓瀏覽器自動化真正上線。"

— 企業用戶評測

📊 產業特定表現

94%
零售業務
88%
公部門
78%
醫療保健

如何開始使用

🌐 Claude.ai(免費/Pro)

Sonnet 4.6 已是預設模型,直接使用即可。免費版新增功能:

  • 檔案創建(File Creation)
  • Connectors 整合
  • Skills 技能
  • Compaction 長對話壓縮

💻 API 存取

model: "claude-sonnet-4-6-20260217"

☁️ 雲端平台

  • Amazon Bedrock:已上線
  • Google Cloud Vertex AI:已上線
  • Claude Cowork:預設模型
  • Claude Code:支援
💡 遷移提示:從 Sonnet 4.5 遷移只需少量 prompt 調整。Anthropic 表示相容性很高。

該選 Sonnet 還是 Opus?

這是很多人的疑問。以下是簡單的決策指南:

✅ 選 Sonnet 4.6

  • 大量 API 呼叫、成本敏感
  • 日常程式碼工作
  • 電腦操作 / 瀏覽器自動化
  • 文件分析、知識工作
  • 大多數商業應用

🔷 選 Opus 4.6

  • 深度科學推理
  • 最高可靠性需求
  • 複雜多學科任務
  • Agentic coding 長時間運行
  • 預算充足、追求極致

"對大多數開發者來說,Sonnet 4.6 現在是預設選擇。Opus 4.6 仍在深度科學推理和最高可靠性場景中佔優,但五倍的價格讓它的適用場景更窄了。"

— NxCode 分析

安全性評估

Anthropic 的安全研究團隊對 Sonnet 4.6 進行了全面評估,結論是:

"Sonnet 4.6 具有溫暖、誠實、利社會,有時還很幽默的特質,擁有非常強的安全行為,且沒有高風險錯位的重大隱憂。"

整體而言,Sonnet 4.6 的安全性與其他近期 Claude 模型相當或更優。

結語:中階模型的分水嶺

Claude Sonnet 4.6 的發布標誌著一個轉捩點:「中階」與「旗艦」的界線正在消失。當中階模型在程式碼和電腦操作上追平旗艦,而價格只有五分之一時,整個產業的成本結構都將被重新定義。

對於設計師和創作者來說,這意味著頂級 AI 能力變得更加觸手可及。無論你是用它來寫程式碼、分析資料、還是自動化重複性工作,Sonnet 4.6 都是 2026 年最值得嘗試的 AI 模型之一。

ClaudeSonnet 4.6AnthropicAI 模型2026

AI 覺醒設計應用攻略

🚀 AI 覺醒設計應用攻略

將 AI 變成你的設計外掛:網頁、繪畫、動畫、影片

一套工作流、一台電腦、一人全開通|NT$399 / 月

文章標籤

# Claude