OpenAI发布GPT-5.4系列模型：原生支持计算机操控

2026-03-06 17:11:03 | 唐薇 | 1038

3月6日，OpenAI正式发布GPT-5.4系列模型，包括面向ChatGPT和API的GPT-5.4 Thinking版本，以及面向复杂任务的GPT-5.4 Pro版本。这是OpenAI首次将前沿推理、编码和智能体能力整合至单一模型中，旨在提升专业工作的效率和准确性。

在ChatGPT中，GPT-5.4 Thinking新增“思考过程预览”功能，模型会在处理复杂查询时预先展示推理思路，用户可在响应过程中实时调整方向，减少来回沟通。该功能已在网页版和Android应用上线，iOS版本即将推出。新模型还增强了深度网络研究能力，在处理高度具体的查询时能更好地保持长上下文连贯性，确保答案在整个过程中保持相关性和连贯性。

在Codex和API层面，GPT-5.4是OpenAI首个具备原生计算机使用能力的通用模型，支持通过截图和键盘鼠标指令操作计算机，完成跨应用的复杂工作流程。系列模型支持高达100万tokens的上下文窗口，使智能体能够规划、执行和验证长周期任务。

GPT-5.4在专业工作领域实现大幅突破。在OpenAI测试的44个职业领域的GDPval基准中，GPT-5.4在83.0%项目上可达到或超过行业专业水平，前代GPT-5.2为70.9%。

在内部投行级电子表格建模任务测试中，GPT-5.4平均得分为87.3%，远高于GPT-5.2的68.4%。在演示文稿评估中，评审者更偏好GPT-5.4生成的演示文稿（68.0% vs. 32.0%），主要优势在于更强的美学设计、更丰富的视觉变化及更有效的图像生成运用。

在减少错误方面，GPT-5.4已成为OpenAI迄今为止最“事实性”的模型。相比GPT-5.2，其单个陈述错误率降低33%，完整回答中出现任一错误的可能性降低18%。

GPT-5.4在计算机使用基准测试中表现优异。在OSWorld-Verified基准（通过截图和键盘鼠标操作PC桌面环境）上，GPT-5.4实现了75.0%的成功率，远超GPT-5.2的47.3%，甚至超过人类表现（72.4%）。

在WebArena-Verified浏览器使用测试中，GPT-5.4结合DOM和截图驱动交互时成功率达67.3%；在Online-Mind2Web测试中，其仅凭观察截图即可实现92.8%的成功率，显著高于ChatGPT Atlas智能体模式的70.9%。

视觉感知能力方面，GPT-5.4在MMMU-Pro视觉理解与推理测试中取得81.2%的成功率，优于GPT-5.2的79.5%。在OmniDocBench文档解析测试中，平均错误率降至0.109。

GPT-5.4融合了GPT-5.3-Codex的编码优势，在SWE-Bench Pro基准上与之持平或表现更优，同时延迟更低。Codex中的“/fast”模式可提升1.5倍token速度，保持同等智能水平。新增的“工具搜索”功能使系列模型能高效处理各种工具。在Scale的MCP Atlas基准测试中，启用工具搜索后，在保持相同准确率的前提下，总token消耗量减少47%。网络搜索能力也得到增强。在BrowseComp基准上，GPT-5.4性能较GPT-5.2提升17个百分点，GPT-5.4 Pro更是创下89.3%的新高。

OpenAI表示，GPT-5.4延续了GPT-5.3-Codex的安全防护措施，并引入新的开源评估“CoT可控性”，测试发现GPT-5.4 Thinking控制其思维链的能力较低，有利于安全监控。定价方面，GPT-5.4 API的每token价格高于GPT-5.2，但其更高的token效率可降低许多任务的总token消耗。批量处理和Flex定价为标准API费率的一半，优先处理为两倍。

GPT-5.4 Thinking即日起面向ChatGPT Plus、Team和Pro用户开放，取代GPT-5.2 Thinking。后者将在模型选择器的“遗留模型”部分保留至2026年6月5日。Enterprise和Edu计划用户可通过管理员设置启用早期访问。GPT-5.4 Pro面向Pro和Enterprise计划用户开放。

在API中，GPT-5.4将以gpt-5.4名称提供支持，GPT-5.4 Pro则以gpt-5.4-pro名称提供给需要极致性能的开发者；Codex中的GPT-5.4支持1M上下文窗口的实验性功能。OpenAI表示，GPT-5.4是首个融合前沿编码能力并在ChatGPT、API和Codex同步推出的主流推理模型，未来Instant模型和Thinking模型将以不同速度演进。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。