贯穿项目:AI 学习助手成长路线
本节定位
这一页把整门课串成一个持续升级的产品项目:AI 学习助手。你可以把每个阶段的小项目都看成这个产品的一次迭代,最后得到一个从命令行工具逐步成长为 RAG、Agent 和多模态助手的完整作品集。
如果你觉得每个阶段都从零开始很割裂,可以按这条主线学习。它会让课程更像“做一个产品”,而不是“看一堆章节”。如果你准备真正开仓库做这个项目,可以直接参考 贯穿项目仓库模板:AI 学习助手。
产品故事
想象你正在做一个陪自己学习 AI 的助手。最开始,它只是一个能运行的 Python 项目;后来它能记录学习任务、分析学习数据、预测学习进度、回答课程问题、调用工具整理资料,最后还能理解截图、课件和多模态内容。
这条路线的目标不是一开始做大系统,而是每学完一站,就给同一个产品补一个能力。
1~3 站:先做一个能记录学习的工具
第 1 站负责搭好开发环境、Git 仓库和项目目录。第 2 站用 Python 做一个命令行学习助手,支持添加任务、查看任务、标记完成、保存到 JSON。第 3 站开始分析学习记录,例如每天学习时长、完成率、最容易拖延的主题,并用图表展示。
这一段的作品重点是“能运行、能保存、能分析”。你不需要 AI 模型,但要开始形成项目习惯:写 README、保存数据、记录错误、截图展示结果。
4~6 站:让助手开始理解数据和模型
第 4 站把数学概念接入项目,例如用向量表示学习主题,用概率理解完成率,用梯度直觉理解模型训练。第 5 站可以做一个学习进度预测或任务分类模型:根据历史记录预测某类任务是否容易延期,或者把学习问题分成环境、语法、数据、模型、RAG、Agent 等类别。第 6 站可以做一个简单文本或图像分类实验,理解深度学习训练曲线和失败样本。
这一段的作品重点是“能评估”。模型分数不是装饰,你要能解释训练集、测试集、baseline、指标和错误样本。
第 7 站:升级成 Prompt 学习助手
进入大模型阶段后,学习助手可以开始接入 LLM API。它可以根据学习目标生成学习计划,帮你把模糊问题改写成清晰 Prompt,把学习笔记整理成结构化摘要,或者根据固定格式生成复盘卡。
这一站的重点不是炫技,而是比较不同 Prompt 的稳定性。你需要记录输入、输出、失败样本和改进过程。
第 8 站:升级成 RAG 课程问答助手
第 8 站是项目的一次关键升级:让助手能读取课程文档、笔记和项目 README,并基于资料回答问题。最小版本只需要支持 Markdown 文档读取、切分、向量化、检索、回答和来源引用。
标准版本继续加入 Hybrid Search、Reranking、Query Rewrite、评估问题集、引用检查和日志。挑战版本可以尝试 GraphRAG、Agentic RAG 或 Multimodal RAG,让系统能处理跨文档关系、主动补查资料或读取截图和 PDF。
第 9 站:升级成 Agent 学习规划助手
第 9 站让助手从“回答问题”升级成“执行学习任务”。例如用户说“帮我准备 RAG 阶段复习”,Agent 可以拆解任务、查找相关课程文档、生成复习计划、列出练习题、检查完成情况,并记录执行轨迹。
这一站最重要的是边界:哪些步骤可以自动执行,哪些需要人工确认;工具调用失败时如何降级;如何记录每一步计划、工具、结果、成本和错误。
第 12 站:升级成多模态学习助手
进入多模态后,学习助手可以处理截图、课件图片、PDF 页面、图表和语音笔记。它可以解释一张模型结构图,提取课件截图里的关键概念,给学习视频生成提纲,或者把学习内容整理成图文复盘卡。
这一站的重点不是只生成漂亮内容,而是把多模态理解、生成、编辑、审核和导出接成工作流。