阶段过渡指南：从基础到 AI 应用

AI 全栈学习最容易卡住的地方，不一定是某个知识点本身，而是不知道为什么突然要学下一个主题。这个页面用一条主线解释各阶段之间的关系，帮助你在切换阶段时知道自己正在补哪块能力。

从开发工具到 Python

开发工具阶段解决的是“你能不能稳定地写代码、运行代码、保存代码”。Python 阶段解决的是“你能不能用代码表达一个清晰流程”。如果开发环境、路径、依赖和 Git 没跑通，后面所有 AI 项目都会被环境问题打断。

进入 Python 前，你至少应该能打开项目目录、运行一个脚本、提交一次 Git 记录。否则学习 Python 时遇到的很多问题，其实不是语法问题，而是环境问题。

Python 教你写流程，数据分析教你处理真实数据。AI 项目里的输入通常不是干净的单个变量，而是文件、表格、日志、文档和用户行为记录。数据分析阶段的价值是让你理解数据的形状、质量、分布和异常。

进入数据分析前，你应该能写函数、读写文件、使用列表和字典。进入机器学习前，你应该能用 Pandas 读取数据、清洗字段、做基础统计，并用图表解释现象。

数据分析回答“发生了什么”，机器学习尝试回答“能不能根据已有数据预测或分类”。这个过渡的关键是把数据表变成特征，把业务问题变成建模问题，把直觉结论变成可评估的模型。

如果你在机器学习阶段卡住，常见原因不是算法太难，而是数据理解不够。比如目标变量是什么、特征是否泄漏、训练集和测试集是否合理、指标是否匹配问题，这些都来自数据分析能力。

机器学习阶段主要训练你理解数据、特征、模型和评估。深度学习阶段进一步让模型自动学习表示，尤其适合图像、文本、语音和复杂序列。这个过渡的关键是从“手工特征 + 传统模型”转向“张量 + 神经网络 + 表示学习”。

进入深度学习前，你应该已经理解训练集/测试集、损失函数、过拟合、评估指标和 baseline。否则 PyTorch 代码即使跑起来，也很难判断模型到底学到了什么。

深度学习让你理解神经网络训练，Transformer 让你理解现代大模型的架构基础。大模型阶段不要求你从零训练一个模型，但要求你理解 token、embedding、上下文、预训练、微调和对齐这些概念的作用。

如果你只想做应用，可以快读底层推导，但不要完全跳过 Transformer 和 embedding。因为 RAG、Prompt、微调、Agent 的很多问题都和这些基础概念有关。

大模型本身有知识过期、幻觉、无法访问私有资料等限制。RAG 的作用是把外部知识库接入生成过程，让模型基于检索到的材料回答问题。这个过渡的关键是从“让模型凭记忆回答”转向“让模型基于来源回答”。

进入 RAG 前，你应该理解 API 调用、文本切分、embedding、向量相似度和基本提示词。学习 RAG 时，要始终把检索和生成分开调试。

RAG 主要解决知识获取问题，Agent 进一步解决任务执行问题。RAG 回答“相关资料是什么、答案是什么”，Agent 处理“为了完成目标，应该分几步、调用哪些工具、如何记录状态、失败后如何恢复”。

进入 Agent 前，你应该已经理解 RAG、函数调用、日志、评估和安全边界。否则 Agent 很容易变成一个不可控的自动化脚本，出了问题也无法追踪。

毕业项目不是把所有技术都塞进去，而是选择一个真实问题，组合合适技术形成稳定闭环。你可以从 AI 学习助手、企业知识库、数据分析 Agent、垂直领域助手或多模态工作流中选择一个方向。

真正的通关标准是：项目能运行，流程能解释，效果能评估，失败能复盘，别人能按 README 复现。到这个阶段，学习重点从“学会某个知识点”转为“做出一个可信的系统”。