概要
推理与控制模式定义了一个智能体如何在思考、行动和停止之间切换。它们更关注系统如何随时间组织决策,而不是模型本身有多智能。为什么这很重要
两个接入同一模型和工具的智能体,可能会因为控制模式不同而表现得非常不一样。一个可能高效搜索,另一个则可能循环、产生幻觉,或者在错误的时间调用错误的工具。 因此,模式选择会影响:- 行动质量
- 可解释性
- 成本和延迟
- 恢复行为
心智模型
导入的参考材料使用 ReAct 作为最清晰的基线。它的核心思想很简单:- 思考当前状态
- 执行一个动作
- 观察结果
- 重复
- 在行动之前
- 在行动之间
- 在失败之后
- 或在明确的停止点
架构图
工具格局
常见的推理与控制模式包括:- 逐步思考-行动-观察循环,适用于开放式工具使用
- 带保护的工具选择,其中动作受到狭窄接口的约束
- 明确的停止或交接规则,防止无限循环
- 可追踪的推理表面,暴露足够的中间状态以调试决策,而不必把每个 token 都强制纳入最终答案
权衡
- 逐步循环具有适应性,但比直接执行更慢,而且如果没有强有力的停止条件,可能会偏离。
- 高可解释性的控制表面更易于调试,但也可能显得冗长且成本更高。
- 窄工具表面可以减少错误,但也可能限制灵活性。
- 丰富的中间推理可以改善决策,但前提是系统能够让这些推理与实际任务保持一致。
- 当工具反馈会改变下一个最佳动作时,优先使用逐步控制
- 在增加更多工具广度之前,先添加明确的停止条件
- 保持控制循环足够可检查,以便调试,即使最终产品会隐藏其中大部分内部机制
引用
延伸阅读
更新日志
- 2026-04-21:基于导入的参考材料和实验室重写规则的首次仓库原生草稿。