Gemini Deep Research是什么
Gemini Deep Research 是谷歌推出的深度研究智能体,基于 Gemini 3 Pro 构建,专为长周期的内容收集与综合任务优化。智能体通过多步骤强化学习,能在复杂信息环境中以高精度自主导航,减少幻觉、提升报告质量。Gemini Deep Research 能迭代规划研究路径,反复搜索和分析数据,生成深入研究报告。Gemini Deep Research 在多个基准测试中取得优异成绩,未来将应用于 Google Search、Google Finance 等产品,通过 Interactions API 向开发者开放,助力构建下一代自动化研究工具。

Gemini Deep Research的主要功能
复杂信息检索与分析:通过多步骤强化学习,自主规划研究路径,包括形成查询、阅读结果、识别知识缺口再次搜索,能深入复杂信息环境中获取精准数据。高质量报告生成:基于 Gemini 3 Pro 模型,减少幻觉,提升报告质量,生成结构化、详细且有引用支持的研究报告。统一信息综合:整合上传文件(如 PDF、CSV)和公共网页数据,处理大上下文量,支持多种数据源的综合分析。可控报告结构:用户能通过提示词定义报告结构、标题、表格格式等,实现高度可定制的输出。精细引用与数据验证:为报告中的每一项事实提供细粒度来源,方便用户追溯和验证数据的原始出处。低成本高效研究:在保持高质量的同时,显著降低生成深度研究报告的成本,提高研究效率。支持结构化输出:支持 JSON 格式输出,便于下游应用解析和进一步处理研究结果。
Gemini Deep Research的性能表现
在 Humanity’s Last Exam (HLE) 中,得分达到 46.4%,表现优于其他同类模型。在 DeepSearchQA 基准测试中,得分 66.1%,展现出强大的多步骤研究能力。在 BrowseComp 测试中,得分 59.2%,与 GPT-5 Pro 相当,成本更低。

如何使用Gemini Deep Research
注册账号:在 Google AI Studio 注册账号并创建项目,获取 Gemini API Key。构建请求:准备任务描述(如“生成关于 AI 在医疗领域的报告”)。提供输入文件链接(如 PDF、CSV)。构建 JSON 请求,包含任务描述、文件链接和输出格式。发送请求:用 Python 或其他编程语言,通过 HTTP POST 方法将请求发送到 Interactions API 端点,在请求头中加入 API Key。处理响应:解析 API 返回的 JSON 数据,提取生成的报告或分析结果。集成到应用:将 Gemini Deep Research 的功能嵌入到应用程序中,设计用户界面,让用户能方便地输入任务获取结果。
Gemini Deep Research的项目官网
项目地址:https://blog.google/technology/developers/deep-research-agent-gemini-api/
Gemini Deep Research的应用场景
金融服务:自动化尽职调查和市场分析,帮助投资团队快速完成早期研究,提升决策效率。