Anthropic发布Claude Sonnet 5:最强智能体AI模型,支持自主规划与工具调用
7月1日,Anthropic今日正式推出Claude Sonnet 5,宣称这是其Sonnet系列中智能体AI表现最强的模型。该模型具备制定计划、使用浏览器和终端等工具并自主运行的能力,定位“工作执行力最强”的版本,而非推理能力最强的版本——后者仍由Claude Opus 4.8代表。
Claude Sonnet 5已同步上线Claude Code和Claude Platform,开发者可通过API指定“claude-sonnet-5”进行调用。定价方面,2026年8月31日前为优惠期,输入每百万tokens 2美元,输出每百万tokens 10美元;优惠期后分别上调至3美元和15美元。
据官方介绍,Sonnet 5是Anthropic“迄今最具智能体能力的Sonnet模型”,在智能体搜索评测BrowseComp和计算机使用评测OSWorld-Verified等项目中,相比前代Sonnet 4.6有明显改进。在BrowseComp的1.8万次搜索真实世界可用信息测试中,Sonnet 5准确率达39.6%,逼近Opus 4.8的41%,远超Sonnet 4.6的28%和DeepResearch的37.4%;在OSWorld-Verified计算机使用基准测试中,Sonnet 5得分24.7%,同样接近Opus 4.8的26.2%。
安全评测方面,Anthropic表示Sonnet 5整体不良行为发生率低于Sonnet 4.6,在恶意请求拒绝、提示注入攻击抵抗、幻觉率和迎合性方面均有改善。
业内分析认为,随着企业客户对自动化复杂工作流的需求攀升,AI模型在代码编写、网页浏览、终端操作等场景中的综合表现正变得至关重要。Anthropic与OpenAI等对手的竞争已从“模型能力”延伸到“工具使用效率”。Sonnet 5以接近旗舰级Opus 4.8的智能体能力配合更低的定价,有望在企业级AI市场占据更具竞争力的位置。