OpenAI发布GPT-5.3-Codex,称其为迄今最强AI编程模型
2月6日,OpenAI宣布推出新一代AI编程模型GPT-5.3-Codex,公司宣称这是其迄今为止最强大的智能体编程模型。该模型在多项基准测试中表现突出,不仅在编程任务上刷新纪录,在复杂环境下的操作能力也有显著提升。
根据官方公布的测试数据,GPT-5.3-Codex在SWE-bench Pro(公开版)编程任务基准中获得56.8%的得分,略高于前代模型的56.4%。在更侧重于命令行操作的Terminal-Bench 2.0测试中,其得分从前代的64.0%大幅提升至77.3%。最引人注目的是在OSWorld-Verified智能体计算机操作基准测试中,得分从38.2%跃升至64.7%,显示出其在执行复杂、开放式环境任务方面取得了突破性进步。
除了能力提升,新模型在运行效率上也进行了优化。官方称其运行速度较前代GPT-5.2-Codex提升了25%,有助于进一步提高开发者的工作效率。
OpenAI强调,GPT-5.3-Codex旨在成为更贴近协作的开发者工具。新模型支持在任务执行过程中进行实时交互与引导,且不会丢失上下文信息。在Codex应用中,模型会持续更新工作进度,允许开发者随时介入、提问、讨论方案并调整方向。公司表示,Codex正从专注于编程的智能体,向更通用的计算机协作者演进,从而降低应用开发的门槛。
目前,GPT-5.3-Codex已面向ChatGPT Plus、Team及Enterprise等付费订阅用户全面开放,用户可通过Codex应用、命令行工具、IDE扩展插件及网页端进行访问。API版本也将在近期推出。