Anthropic发布Claude Sonnet 4.5模型,称其成全球最强编码与智能体AI
9月30日,人工智能公司Anthropic正式推出新一代模型Claude Sonnet 4.5。官方宣称该模型在编码、计算机操作及复杂任务处理方面达到全球领先水平,是目前“最出色的编码模型”和“构建复杂智能体的最强模型”,同时在推理与数学能力上也实现显著提升。
Claude Sonnet 4.5已在全平台上线,开发者可通过Claude API直接调用,定价维持每百万tokens输入3美元、输出15美元,与上一代版本一致。在体现实战编码能力的SWE-bench Verified评测中,该模型表现达到行业顶尖,可持续超过30小时专注处理复杂多步骤任务,并稳定输出高质量代码。
模型在计算机操作能力上取得重要突破:在OSWorld基准测试中以61.4%的得分位居全球第一,较4个月前Claude Sonnet 4的42.2%有大幅提升。结合Claude谷歌浏览器扩展,用户可直接在浏览器内实现网页导航、表格填写等完整任务流的自动化执行。
除技术能力升级外,Anthropic同步推出多项产品功能更新,包括Claude Code中的“检查点”进度保存、原生VS Code扩展、API上下文编辑与记忆工具,以及在应用内直接支持代码执行和文件创建。同时,公司还向开发者开放了Claude Agent SDK,助力构建定制化智能体。