谷歌发布Gemini Deep Research深度研究智能体,首次面向开发者开放
12月12日,在OpenAI发布GPT-5.2数小时后,谷歌迅速作出回应,正式推出更强大的Gemini Deep Research深度研究智能体。该智能体基于Gemini 3 Pro模型构建,旨在执行长周期、多步骤的信息检索与综合分析任务,并首次通过全新的Interactions API向开发者开放。同时,谷歌宣布开源深度搜索评估基准DeepSearchQA,标志着AI自主研究能力正式迈向工业化应用阶段。
谷歌DeepMind产品经理路卡斯・哈斯透露,Gemini Deep Research在多项测试中达到业内领先水平,其中在谷歌全新基准测试DeepSearchQA上获得46.4%的得分。相较于同类产品,该智能体在保持相当性能的同时,成本仅为竞争对手的十分之一左右。
Deep Research智能体通过强化学习优化搜索路径,能够自主规划并执行多次查询、阅读结果、识别信息缺口并进行补充搜索,其网页抓取能力也得到显著增强。谷歌表示,这项技术未来将整合至Google Search、NotebookLM、Google Finance及Gemini应用生态中。
为更准确地评估复杂研究任务中的AI表现,谷歌同步开源了DeepSearchQA基准。该数据集涵盖17个领域、共900项具有因果链依赖的复杂任务,要求模型通过多步骤检索与推理生成全面答案。谷歌表示,此基准不仅可用于衡量研究智能体的性能,还能作为优化“思考时间”与推理步骤的诊断工具。
目前,Gemini Deep Research已在金融、生物科技及市场研究等多个高精度需求领域展开应用。例如,金融机构使用该智能体自动化早期尽调中的信息整合,而生物科技公司则借助其加速药物毒性预测相关的文献分析流程。
通过新开放的Interactions API,开发者能够调用Deep Research构建自动化研究工具,实现跨文件(如PDF、CSV)与网页数据的统一分析、结构化报告输出以及细粒度的引用管理。谷歌表示,未来还将为该平台增加图表生成、扩展Model Context Protocol支持,并在Vertex AI企业服务平台中提供Deep Research服务。