ChatGPT语音模式正式融入主聊天界面

2025-11-26 18:06:34 | 探索者 | 1429

11月26日，OpenAI宣布完成对ChatGPT语音功能的重大升级，将原先独立的“语音模式”全面整合至主聊天界面，实现了语音、文本与视觉信息的无缝融合，为用户带来更加自然流畅的多模态交互体验。

在过去，语音对话是ChatGPT中一个相对独立的功能模块，用户需要专门切换到语音模式才能进行语音交流。这种设计在一定程度上割裂了用户体验。随着此次更新的推出，用户现在可以直接在主聊天窗口内启动语音交互，无需再在不同模式间来回切换。这一改变使得ChatGPT的对话体验更加接近人类自然的交流方式——在对话过程中，我们可以随时引入视觉信息，也可以自由地在语音与文本间切换。

新版语音模式最引人注目的特点在于其强大的多模态能力。当用户通过语音提出问题，ChatGPT不仅会用流畅自然的语音进行回复，还能在聊天界面中同步显示相关的视觉内容。无论是查询路线时展示的地图，讨论数据时呈现的图表，还是描述场景时提供的图片，这些视觉信息都能够与语音回答完美配合，极大丰富了对话的信息维度。

同时，系统还会自动生成语音对话的文字转录稿。这一功能不仅方便用户在对话结束后回顾交流内容，也为在嘈杂环境或不方便播放语音的场景下查阅信息提供了便利，体现出OpenAI对用户多样化使用场景的细致考量。

尽管新版整合设计带来了更加统一的交互体验，OpenAI也充分尊重用户的使用习惯。对于那些偏爱沉浸式纯音频对话体验的用户，新版本在应用设置中提供了切换开关，可以一键恢复到旧版的独立语音模式。这种灵活的设计思路，展现出OpenAI在推进产品革新同时，对用户个性化需求的充分尊重。

此次语音功能的升级，是OpenAI近期一系列产品迭代中的重要一环。从推出AI购物助手、支持iCloud钥匙串的Atlas AI浏览器新功能，到在部分地区上线的群聊功能以及性能更强的GPT-5.1模型，OpenAI正在全方位地拓展人工智能的应用边界。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。