前置知识检查清单

这份清单用于在进入关键阶段前快速判断自己是否准备好了。如果某一项不熟，不代表不能继续学，但建议先回到对应章节补一个最小练习。AI 全栈学习最怕的是前置知识缺口不断累积，最后感觉“每一章都看得懂一点，但项目做不出来”。

进入 Python 前

你应该能完成这些动作：打开终端，进入项目目录，创建文件，运行一个命令，理解当前工作目录，知道错误信息来自哪条命令。如果这些还不熟，先回到开发者工具基础阶段。

你应该能写函数、使用列表和字典、读写文件、安装第三方库，并理解脚本的输入和输出。进入 Pandas 前，最好能用纯 Python 读取一个文本文件并统计内容。

你应该能读取表格数据，查看行列，处理缺失值，理解训练数据和目标变量的区别，能用图表描述数据分布。机器学习不是从算法开始，而是从“这个问题能不能被数据表达”开始。

你应该理解训练集、验证集、测试集、特征、标签、损失函数、过拟合和评估指标。还应该对矩阵、向量和数组 shape 有基本直觉。否则 PyTorch 的张量错误会非常难排查。

你应该理解什么是模型输入输出、什么是 API、什么是 JSON、什么是上下文，以及为什么模型回答可能不稳定。Prompt 不是魔法句子，而是把任务、约束、输入和输出格式清楚交给模型。

你应该能完成一次 LLM API 调用，理解文本切分，知道 embedding 是把文本变成向量，理解相似度检索，能区分“检索结果”和“生成答案”。如果你无法查看检索到的原文片段，RAG 调试会很困难。

你应该理解函数调用、工具参数、错误处理、日志、状态和权限。Agent 不是简单地让模型多思考，而是让模型在受控边界内调用工具完成任务。进入 Agent 前，最好先能写一个普通函数调用工作流。

你应该能说明项目依赖、运行命令、配置项、环境变量、日志位置和错误排查方式。部署不是最后一步才考虑的事情，而是检验项目是否可复现的重要环节。

每进入一个新阶段前，用 10 分钟检查对应条目。不会的地方不要长时间停留在理论解释上，优先补一个最小练习。例如不熟 JSON，就写一个读写 JSON 的脚本；不熟 API，就调用一次公开接口；不熟日志，就给自己的小程序加一条运行日志。