学习指南:LLM 应用开发与 RAG 怎么学最不容易学乱
如果你来到 07 LLM 应用开发与 RAG 后觉得框架、数据库、部署和应用逻辑混在一起,先把系统分层。LLM 应用不是只调一个接口,而是把知识、模型、应用和工程接起来。
本阶段总原则
LLM 应用第一遍要抓住四层:知识层负责资料进入系统,模型层负责生成和理解,应用层负责功能组织,工程层负责稳定运行。
推荐学习顺序
第一轮先学 RAG。你要知道文档如何解析、切分、向量化、检索、重排,并进入模型上下文。
第二轮学模型部署和统一接口。你要理解云端 API、本地模型、推理服务和统一调用层的区别。
第三轮学应用开发。包括 LLM API、Function Calling、对话系统、文档解析、模板生成和 AI 辅助编码。
第四轮学工程化。异步、API 设计、日志、监控、错误处理、Docker 和部署应该在你跑通最小应用后再逐步加入。
第五轮做综合项目,把知识库、模型调用、应用功能和工程化连接起来。
建议学习节奏
| 内容类型 | 建议时间 | 学习目标 |
|---|---|---|
| RAG 基础 | 8~16 小时 | 跑通文档到答案的链路 |
| 模型部署 | 4~8 小时 | 理解模型如何被稳定调用 |
| 应用开发 | 8~16 小时 | 能封装对话、工具和结构化输出 |
| 工程化 | 8~16 小时 | 能加入日志、错误处理和部署说明 |
| 综合项目 | 16~32 小时 | 完成一个可展示的 LLM 应用 |
阶段项目路线
第一个项目建议做最小 RAG:准备几篇文档,切分、向量化、检索,并让模型基于资料回答。
第二个项目建议做课程问答助手或个人知识库,加入来源引用、检索结果展示和反馈记录。
第三个项目建议做企业知识库 Demo,加入多轮对话、权限设想、日志和评估样例。
常见卡点
最常见的卡点是以为接入向量数据库就完成了 RAG。真正影响效果的是文档质量、切分策略、检索召回、重排、提示组织和评估数据。
第二个卡点是一上来就追框架。建议先手写最小 RAG,再学 LangChain、LlamaIndex 等框架。
第三个卡点是只做成功 Demo,不处理失败。真实应用必须考虑 无答案、检索不到、模型超时、输出格式错误和成本过高。
过关标准
学完本阶段后,你应该能独立完成一个 RAG 应用,能解释数据从文档到答案的完整路径,并能定位效果差可能发生在哪一层。
如果你能做出一个带来源引用、基础日志和简单评估样例的知识库助手,就可以进入 AI Agent 阶段。