ChatGPT语音模式正式融入主聊天界面
11月26日,OpenAI宣布完成对ChatGPT语音功能的重大升级,将原先独立的“语音模式”全面整合至主聊天界面,实现了语音、文本与视觉信息的无缝融合,为用户带来更加自然流畅的多模态交互体验。
在过去,语音对话是ChatGPT中一个相对独立的功能模块,用户需要专门切换到语音模式才能进行语音交流。这种设计在一定程度上割裂了用户体验。随着此次更新的推出,用户现在可以直接在主聊天窗口内启动语音交互,无需再在不同模式间来回切换。这一改变使得ChatGPT的对话体验更加接近人类自然的交流方式——在对话过程中,我们可以随时引入视觉信息,也可以自由地在语音与文本间切换。
新版语音模式最引人注目的特点在于其强大的多模态能力。当用户通过语音提出问题,ChatGPT不仅会用流畅自然的语音进行回复,还能在聊天界面中同步显示相关的视觉内容。无论是查询路线时展示的地图,讨论数据时呈现的图表,还是描述场景时提供的图片,这些视觉信息都能够与语音回答完美配合,极大丰富了对话的信息维度。
同时,系统还会自动生成语音对话的文字转录稿。这一功能不仅方便用户在对话结束后回顾交流内容,也为在嘈杂环境或不方便播放语音的场景下查阅信息提供了便利,体现出OpenAI对用户多样化使用场景的细致考量。
尽管新版整合设计带来了更加统一的交互体验,OpenAI也充分尊重用户的使用习惯。对于那些偏爱沉浸式纯音频对话体验的用户,新版本在应用设置中提供了切换开关,可以一键恢复到旧版的独立语音模式。这种灵活的设计思路,展现出OpenAI在推进产品革新同时,对用户个性化需求的充分尊重。
此次语音功能的升级,是OpenAI近期一系列产品迭代中的重要一环。从推出AI购物助手、支持iCloud钥匙串的Atlas AI浏览器新功能,到在部分地区上线的群聊功能以及性能更强的GPT-5.1模型,OpenAI正在全方位地拓展人工智能的应用边界。