阶段学习任务单:AI Agent 与智能体系统
这个阶段的目标是让你理解 Agent 如何把大模型、工具、记忆、规划和执行流程连接起来。不要把 Agent 理解成“更会聊天的模型”,它更接近一个能分解任务、调用工具、记录状态并处理失败的工作流系统。
本阶段必须完成的任务
| 任务 | 产出物 | 通过标准 |
|---|---|---|
| 理解 Agent 基本结构 | 一张架构图 | 能解释模型、工具、记忆、规划器和执行器的关系 |
| 跑通工具调用 | 一个最小 tool calling 示例 | 能定义工具参数、处理返回值和错误 |
| 完成规划执行流程 | 一个多步骤任务 Demo | 能记录每一步输入、输出、状态和失败原因 |
| 加入评估与安全 | 一份 Agent 测试记录 | 能评估任务成功率、工具准确率和权限风险 |
| 完成阶段项目 | 一个可追踪 Agent 项目 | 有 trace、日志、回放样例和人工确认边界 |
推荐学习顺序
先理解 Agent 是什么,再学习推理与规划、工具调用、记忆、MCP、框架、多 Agent、评估与安全。框架可以帮助实现,但不要让框架掩盖核心问题:状态如何流转,工具何时调用,失败如何恢复,权限如何限制。
学 Agent 时要特别注意可观测性。一个 Agent 如果不能解释自己做了什么、为什么这么做、在哪一步失败,就很难进入真实应用。
和 AI 学习助手项目的关系
本阶段对应 AI 学习助手的 v0.9 学习规划 Agent。它不仅能回答问题,还能根据学习目标拆解任务,推荐章节,生成学习计划,调用检索工具查资料,并记录每一步执行轨迹。
建议最小功能包括:输入学习目标,输出阶段计划;调用课程检索工具查找相关章节;生成本周任务清单;记录 trace。标准版本可以加入长期学习记录、复习提醒、错题整理和人工确认。
常见卡点
常见问题包括工具描述不清导致调用错误、Agent 无限循环、任务拆解过细或过粗、记忆污染、把用户输入直接传给工具造成安全风险、没有日志导致无法排查问题。Agent 项目里,权限边界和停止条件和功能本身一样重要。
阶段通关问题
学完后,你应该能回答这些问题:Agent 和普通 LLM 应用有什么区别,工具描述为什么重要,什么任务适合 Agent,如何避免循环调用,为什么需要 trace、replay 和人工确认。
完成状态 Checklist
- 我能解释 Agent、普通 LLM 应用和 RAG 应用的区别。
- 我能定义一个工具的名称、用途、参数和返回值。
- 我能记录 Agent 的计划、工具调用、输出、错误和停止条件。
- 我已经完成一个可追踪的学习规划 Agent 或等价多步骤任务 Demo。
- 我能说明哪些操作需要人工确认,哪些工具权限必须限制。