Anthropic推出Claude Opus 4.8:编程可靠性提升,成本降至此前1/3

2026-05-29 17:25:15   |   文白不白   |   1533

5月29日,Anthropic宣布推出旗舰新模型Claude Opus 4.8,主打更强的智能体编程、多领域推理和知识工作能力。官方表示,相比Opus 4.7,本次更新幅度较小,在保持价格不变的情况下,主要提升编程、智能体、推理和知识工作等用户能感知的方面。

官方援引多家早期测试方反馈称,Opus 4.8“更可靠,判断也更敏锐”,在复杂多步骤任务中判断更稳,能主动提问、识别自身错误,并在计划不合理时提出异议。官方评估显示,和前代相比,Opus 4.8放任自己所写代码缺陷却不加说明的概率降低至四分之一,更愿意主动标出不确定性,减少缺乏依据的结论。在对齐表现方面,Opus 4.8在支持用户自主性、按用户最佳利益行动等亲社会指标上创下新高,欺骗等失配行为的出现率低于Opus 4.7。

配套功能方面,claude.ai新增effort程度控制,用户可平衡更高质量与更快响应。默认high档在编码任务中token消耗与Opus 4.7默认档接近但效果更好;选择extra或max更高档位时,模型会消耗更多tokens以换取更优结果。基准测试方面,Anthropic称Opus 4.8在SWE-Bench Pro上得到69.2%,在该测试和其他多项基准中超过GPT-5.5与Gemini 3.1 Pro,但终端编程基准上GPT-5.5仍然领先。

本次更新还带来性能和价格调整。Opus 4.8的快速模式运行速度提升至2.5倍,模型成本降至此前模型的1/3。定价方面,常规模式维持每100万输入令牌5美元、每100万输出令牌25美元;快速模式为每100万输入令牌10美元、每100万输出令牌50美元。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

Anthropic推出Claude Opus 4.8:编程可靠性提升,成本降至此前1/3

2026-05-29 17:25:15 浏览量: 1533 作者: 文白不白

5月29日,Anthropic宣布推出旗舰新模型Claude Opus 4.8,主打更强的智能体编程、多领域推理和知识工作能力。官方表示,相比Opus 4.7,本次更新幅度较小,在保持价格不变的情况下,主要提升编程、智能体、推理和知识工作等用户能感知的方面。

官方援引多家早期测试方反馈称,Opus 4.8“更可靠,判断也更敏锐”,在复杂多步骤任务中判断更稳,能主动提问、识别自身错误,并在计划不合理时提出异议。官方评估显示,和前代相比,Opus 4.8放任自己所写代码缺陷却不加说明的概率降低至四分之一,更愿意主动标出不确定性,减少缺乏依据的结论。在对齐表现方面,Opus 4.8在支持用户自主性、按用户最佳利益行动等亲社会指标上创下新高,欺骗等失配行为的出现率低于Opus 4.7。

配套功能方面,claude.ai新增effort程度控制,用户可平衡更高质量与更快响应。默认high档在编码任务中token消耗与Opus 4.7默认档接近但效果更好;选择extra或max更高档位时,模型会消耗更多tokens以换取更优结果。基准测试方面,Anthropic称Opus 4.8在SWE-Bench Pro上得到69.2%,在该测试和其他多项基准中超过GPT-5.5与Gemini 3.1 Pro,但终端编程基准上GPT-5.5仍然领先。

本次更新还带来性能和价格调整。Opus 4.8的快速模式运行速度提升至2.5倍,模型成本降至此前模型的1/3。定价方面,常规模式维持每100万输入令牌5美元、每100万输出令牌25美元;快速模式为每100万输入令牌10美元、每100万输出令牌50美元。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号