OpenAI推出新一代编程模型GPT-5.1-Codex-Max,AI编程迈入“通宵工作”新时代

2025-11-20 17:16:33   |   唐薇   |   930

在谷歌发布Gemini 3 Pro仅仅数日后,人工智能领域再次迎来重要突破。11月20日,OpenAI正式推出其新一代编程模型GPT-5.1-Codex-Max,这款被业界称为“最强AI程序员”的模型不仅在多项基准测试中反超竞争对手,更以其革命性的“压缩”机制,首次实现了AI模型持续24小时以上的复杂编程任务执行能力。

在这场编程模型的巅峰对决中,Codex-Max交出了一份令人瞩目的成绩单。在衡量实际软件问题解决能力的SWE-Bench Verified测试中,Codex-Max以77.9%的准确率小幅领先Gemini 3 Pro的76.2%。而在Terminal-Bench 2.0测试中,其58.1%的准确率同样优于对手的54.2%。这些数据表明,OpenAI在新一轮的编程AI竞赛中已经重新夺回了技术领先地位。

Codex-Max最引人注目的突破在于其创新的“压缩”机制。这一架构升级使得模型在接近上下文窗口限制时,能够智能地保留关键信息并舍弃无关细节,从而实现了跨越数百万token的连续工作而不出现性能衰减。这项技术不仅让模型在内部测试中成功完成了持续超过24小时的多步骤代码重构和自主调试任务,还带来了约30%的token效率提升,显著降低了运算成本与延迟。

目前,这一新一代模型已深度集成到OpenAI自家的多个Codex开发环境中,包括官方命令行工具、内部代码审查系统以及各类交互式编程界面。开发者通过这些工具可以体验到模型强大的实时交互能力,无论是在可视化界面中进行强化学习训练,还是模拟复杂的光学定律,Codex-Max都展现出了前所未有的流畅性。

OpenAI透露,公司内部95%的工程师每周都会使用Codex系统,自采用以来,这些工程师平均多提交了约70%的拉取请求,开发效率得到了显著提升。

尽管Codex-Max具备了高度自主性,OpenAI仍强调其定位是编码“助手”而非人类程序员的替代品。为了确保透明度,模型会生成详细的终端日志和测试引用,方便开发者审查和验证所有生成代码。同时,模型默认在严格的沙盒环境中运行,并禁用了网络访问权限,充分体现了OpenAI对AI安全的一贯重视。

目前,GPT-5.1-Codex-Max尚未通过公共API对外开放,但官方表示即将向开发者社区开放这一能力。普通用户则需要订阅ChatGPT Plus、Pro或企业版等付费计划才能体验这一尖端技术。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

OpenAI推出新一代编程模型GPT-5.1-Codex-Max,AI编程迈入“通宵工作”新时代

2025-11-20 17:16:33 浏览量: 930 作者: 唐薇

在谷歌发布Gemini 3 Pro仅仅数日后,人工智能领域再次迎来重要突破。11月20日,OpenAI正式推出其新一代编程模型GPT-5.1-Codex-Max,这款被业界称为“最强AI程序员”的模型不仅在多项基准测试中反超竞争对手,更以其革命性的“压缩”机制,首次实现了AI模型持续24小时以上的复杂编程任务执行能力。

在这场编程模型的巅峰对决中,Codex-Max交出了一份令人瞩目的成绩单。在衡量实际软件问题解决能力的SWE-Bench Verified测试中,Codex-Max以77.9%的准确率小幅领先Gemini 3 Pro的76.2%。而在Terminal-Bench 2.0测试中,其58.1%的准确率同样优于对手的54.2%。这些数据表明,OpenAI在新一轮的编程AI竞赛中已经重新夺回了技术领先地位。

Codex-Max最引人注目的突破在于其创新的“压缩”机制。这一架构升级使得模型在接近上下文窗口限制时,能够智能地保留关键信息并舍弃无关细节,从而实现了跨越数百万token的连续工作而不出现性能衰减。这项技术不仅让模型在内部测试中成功完成了持续超过24小时的多步骤代码重构和自主调试任务,还带来了约30%的token效率提升,显著降低了运算成本与延迟。

目前,这一新一代模型已深度集成到OpenAI自家的多个Codex开发环境中,包括官方命令行工具、内部代码审查系统以及各类交互式编程界面。开发者通过这些工具可以体验到模型强大的实时交互能力,无论是在可视化界面中进行强化学习训练,还是模拟复杂的光学定律,Codex-Max都展现出了前所未有的流畅性。

OpenAI透露,公司内部95%的工程师每周都会使用Codex系统,自采用以来,这些工程师平均多提交了约70%的拉取请求,开发效率得到了显著提升。

尽管Codex-Max具备了高度自主性,OpenAI仍强调其定位是编码“助手”而非人类程序员的替代品。为了确保透明度,模型会生成详细的终端日志和测试引用,方便开发者审查和验证所有生成代码。同时,模型默认在严格的沙盒环境中运行,并禁用了网络访问权限,充分体现了OpenAI对AI安全的一贯重视。

目前,GPT-5.1-Codex-Max尚未通过公共API对外开放,但官方表示即将向开发者社区开放这一能力。普通用户则需要订阅ChatGPT Plus、Pro或企业版等付费计划才能体验这一尖端技术。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号