跳转到主要内容

摘要

深度研究智能体会把一个开放主题转化为一项受管理的调查。它不是只根据一个提示或一个搜索结果作答,而是会规划工作、分轮收集证据、总结阶段性发现,并编制一份可追溯的报告。

为什么这很重要

研究是最清晰的产品表面之一,在这里,智能体系统既可能有用,也可能危险。 有用,是因为这项工作天然可以拆解为搜索、阅读、记笔记和综合。 危险,是因为用户会期待新鲜度、来源质量,以及对不确定性的诚实处理。一份看起来精致、却没有可靠证据链的答案,不是真正的研究产品。

心智模型

最稳健的模式是一个四部分循环:
  • plan: 将主题拆解为有边界的研究任务
  • collect: 为每个任务收集证据
  • synthesize: 在上下文超载之前总结每个任务
  • report: 结合明确的来源和开放问题,组装最终答案
这更适合被理解为一个受管理的工作流,而不是一个单一的巧妙提示词。规划器负责控制调查范围。收集器扩展证据集合。总结器防止原始搜索结果淹没最终报告。报告撰写器将结果整合为面向读者的成品。

架构图

工具生态

深度研究系统通常会结合一套规模不大但立场明确的工具集:
  • 用于收集证据的搜索或浏览工具
  • 用于结构化中间状态的笔记或工件存储
  • 用于保持任务输出有边界的总结逻辑
  • 用于保留引用和不确定性的报告生成
在这里,人工检查点比许多其他智能体产品更重要。
  • 规划审核可防止浪费搜索轮次
  • 来源审核可发现薄弱或无关的证据
  • 最终审核可发现缺乏支持的综合结论和语气漂移
工件策略也很重要。好的系统会把明确的任务列表、任务摘要和最终报告作为可检查的输出保留下来。这些工件有助于验证、恢复流程以及后续复用。

权衡

  • 更广泛的搜索提升覆盖面,但也会增加噪音和来源质量差异。
  • 更激进的任务拆解提升控制力,但过多任务会带来开销和重复。
  • 强总结能保持上下文整洁,但如果没有保留引用,它可能会隐藏细节。
  • 单一最终答案读起来更流畅,但分阶段的工件轨迹更值得信赖。
实践中的默认做法:
  • 先规划,再搜索
  • 将引用附着在任务层,而不只放在最终报告中
  • 将“未知”视为有效输出
  • 将证据收集与最终叙述生成分开

引用

延伸阅读

更新日志

  • 2026-04-21:基于导入的参考材料和实验室重写规则生成的首个仓库原生草稿。