Skip to main content

9.2.1 推理路线图:计划、行动、检查

Agent 推理不是更长的回答,而是生成可用中间步骤、决定下一步做什么,并检查计划是否还有效。

先看规划闭环

Agent 推理与规划章节学习顺序图

计划执行监控重规划图

推理状态检查点图

核心习惯是:规划一步、行动、观察结果、记录状态检查点,并在情况变化时重新规划。

跑一个计划检查表

加工具之前先显式写出步骤。不能打印出来的计划,很难检查。

task = "prepare a cited RAG demo answer"
plan = ["inspect question", "retrieve sources", "draft answer", "check citations"]

print("task:", task)
for index, step in enumerate(plan, start=1):
print(f"{index}. {step}")
print("checkpoint:", plan[-1])

预期输出:

task: prepare a cited RAG demo answer
1. inspect question
2. retrieve sources
3. draft answer
4. check citations
checkpoint: check citations

好的规划应该可见,并让失败更容易定位,而不是把问题藏在最后一段话里。

按这个顺序学

步骤阅读实操产出
1LLM 推理能力区分知道答案和推导路径
2链式推理建立中间状态和自检点
3ReAct交替进行思考、行动、观察和下一步
4Plan-and-Execute任务变大时分离规划和执行
5高级规划处理依赖、优先级、回滚和重规划
6推理评估评估最终结果、路径质量和失败类型

通过标准

如果你能说明一个计划为什么失败:拆解差、工具选错、观察过期、缺少检查点或最终验证太弱,就通过了本章。

本章出口小项目是一个可见推理 trace:包含计划步骤、观察、重规划和最终回答。