9.2.1 推理路线图:计划、行动、检查
Agent 推理不是更长的回答,而是生成可用中间步骤、决定下一步做什么,并检查计划是否还有效。
先看规划闭环



核心习惯是:规划一步、行动、观察结果、记录状态检查点,并在情况变化时重新规划。
跑一个计划检查表
加工具之前先显式写出步骤。不能打印出来的计划,很难检查。
task = "prepare a cited RAG demo answer"
plan = ["inspect question", "retrieve sources", "draft answer", "check citations"]
print("task:", task)
for index, step in enumerate(plan, start=1):
print(f"{index}. {step}")
print("checkpoint:", plan[-1])
预期输出:
task: prepare a cited RAG demo answer
1. inspect question
2. retrieve sources
3. draft answer
4. check citations
checkpoint: check citations
好的规划应该可见,并让失败更容易定位,而不是把问题藏在最后一段话里。
按这个顺序学
| 步骤 | 阅读 | 实操产出 |
|---|---|---|
| 1 | LLM 推理能力 | 区分知道答案和推导路径 |
| 2 | 链式推理 | 建立中间状态和自检点 |
| 3 | ReAct | 交替进行思考、行动、观察和下一步 |
| 4 | Plan-and-Execute | 任务变大时分离规划和执行 |
| 5 | 高级规划 | 处理依赖、优先级、回滚和重规划 |
| 6 | 推理评估 | 评估最终结果、路径质量和失败类型 |
通过标准
如果你能说明一个计划为什么失败:拆解差、工具选错、观察过期、缺少检查点或最终验证太弱,就通过了本章。
本章出口小项目是一个可见推理 trace:包含计划步骤、观察、重规划和最终回答。