谷歌发布Gemini 3系列AI模型,开启多模态智能新时代
11月19日凌晨,谷歌正式推出新一代Gemini 3系列人工智能模型,这场被业界视为“关键反击”的发布,标志着AI竞赛进入全新阶段。面对竞争对手GPT-5的上线受阻,谷歌此次亮出的“王牌”被寄予厚望,有望重新夺回在消费者AI领域的主导地位。
Gemini 3 Pro作为该系列的旗舰模型,最大的突破在于实现了真正的“原生多模态”能力。与以往需要分别处理文字、图像和音频的系统不同,这款模型能够同时理解多种信息形式。谷歌通过生动实例展示了这一能力:只需给模型一张菜肴照片,它就能自动整理出完整的食谱;面对多段教学视频,则可以生成交互式学习卡片。这种融合感知能力让AI更贴近人类的认知方式。
谷歌DeepMind高级总监Tulsee Doshi强调:“我们正在迈出关键一步,摆脱只能生成文本回复的局限,转向更完整、更丰富的表达方式。”这一理念已经体现在谷歌系列产品的升级中——从Gemini应用内的Canvas工作区到正在测试的“生成式界面”,用户都能体验到更智能的创作体验。
搜索体验的颠覆性变革
在搜索领域,Gemini 3 Pro带来了更具颠覆性的改变。接入谷歌搜索的AI模式后,模型能够以更直观的形式呈现信息,包括图片、表格、网格甚至交互式模拟内容。得益于升级的“查询扇出技术”,系统不仅能拆分复杂问题,更能深入理解用户的搜索意图,挖掘出那些以往可能被遗漏的信息。
值得注意的是,谷歌在此次发布中特别强调了模型的“真实性”。官方毫不避讳地指出,Gemini 3 Pro不会像某些竞争对手那样习惯性讨好用户。Doshi表示,新模型的回答将“更加直接和准确,用真正的洞察取代客套话,告诉用户需要知道的内容,而不是迎合他们想听的话。”这一表态直指ChatGPT此前因过度奉承用户而被迫修正的问题。
智能代理能力的飞跃
除了对话能力的提升,Gemini 3 Pro在推理和智能代理方面也实现显著进步。模型现能处理更复杂的任务,并展现出稳定的长期规划能力。基于该技术打造的Gemini智能代理已经开始测试,未来可以帮助用户完成整理邮件、搜索并预订行程等日常事务。
目前,Gemini 3 Pro已在Gemini应用中向所有用户开放,同时登陆谷歌搜索订阅服务。在美国地区,Google AI Pro和Ultra订阅用户可以在搜索的AI模式中选择“Thinking”来体验这一最新技术。随着Gemini智能代理功能率先向AI Ultra订阅用户开放,谷歌正一步步将“让信息普遍可得并真正有用”的愿景变为现实。