跳到主要内容

阶段学习任务单:AI Agent 与智能体系统

这个阶段的目标是让你理解 Agent 如何把大模型、工具、记忆、规划和执行流程连接起来。不要把 Agent 理解成“更会聊天的模型”,它更接近一个能分解任务、调用工具、记录状态并处理失败的工作流系统。

本阶段必须完成的任务

任务产出物通过标准
理解 Agent 基本结构一张架构图能解释模型、工具、记忆、规划器和执行器的关系
跑通工具调用一个最小 tool calling 示例能定义工具参数、处理返回值和错误
完成规划执行流程一个多步骤任务 Demo能记录每一步输入、输出、状态和失败原因
加入评估与安全一份 Agent 测试记录能评估任务成功率、工具准确率和权限风险
完成阶段项目一个可追踪 Agent 项目有 trace、日志、回放样例和人工确认边界

推荐学习顺序

先理解 Agent 是什么,再学习推理与规划、工具调用、记忆、MCP、框架、多 Agent、评估与安全。框架可以帮助实现,但不要让框架掩盖核心问题:状态如何流转,工具何时调用,失败如何恢复,权限如何限制。

学 Agent 时要特别注意可观测性。一个 Agent 如果不能解释自己做了什么、为什么这么做、在哪一步失败,就很难进入真实应用。

和 AI 学习助手项目的关系

本阶段对应 AI 学习助手的 v0.9 学习规划 Agent。它不仅能回答问题,还能根据学习目标拆解任务,推荐章节,生成学习计划,调用检索工具查资料,并记录每一步执行轨迹。

建议最小功能包括:输入学习目标,输出阶段计划;调用课程检索工具查找相关章节;生成本周任务清单;记录 trace。标准版本可以加入长期学习记录、复习提醒、错题整理和人工确认。

常见卡点

常见问题包括工具描述不清导致调用错误、Agent 无限循环、任务拆解过细或过粗、记忆污染、把用户输入直接传给工具造成安全风险、没有日志导致无法排查问题。Agent 项目里,权限边界和停止条件和功能本身一样重要。

阶段通关问题

学完后,你应该能回答这些问题:Agent 和普通 LLM 应用有什么区别,工具描述为什么重要,什么任务适合 Agent,如何避免循环调用,为什么需要 trace、replay 和人工确认。

完成状态 Checklist

  • 我能解释 Agent、普通 LLM 应用和 RAG 应用的区别。
  • 我能定义一个工具的名称、用途、参数和返回值。
  • 我能记录 Agent 的计划、工具调用、输出、错误和停止条件。
  • 我已经完成一个可追踪的学习规划 Agent 或等价多步骤任务 Demo。
  • 我能说明哪些操作需要人工确认,哪些工具权限必须限制。