跳到主要内容

学习指南:LLM 应用开发与 RAG 怎么学最不容易学乱

如果你来到 07 LLM 应用开发与 RAG 后觉得框架、数据库、部署和应用逻辑混在一起,先把系统分层。LLM 应用不是只调一个接口,而是把知识、模型、应用和工程接起来。

本阶段总原则

LLM 应用第一遍要抓住四层:知识层负责资料进入系统,模型层负责生成和理解,应用层负责功能组织,工程层负责稳定运行。

推荐学习顺序

第一轮先学 RAG。你要知道文档如何解析、切分、向量化、检索、重排,并进入模型上下文。

第二轮学模型部署和统一接口。你要理解云端 API、本地模型、推理服务和统一调用层的区别。

第三轮学应用开发。包括 LLM API、Function Calling、对话系统、文档解析、模板生成和 AI 辅助编码。

第四轮学工程化。异步、API 设计、日志、监控、错误处理、Docker 和部署应该在你跑通最小应用后再逐步加入。

第五轮做综合项目,把知识库、模型调用、应用功能和工程化连接起来。

建议学习节奏

内容类型建议时间学习目标
RAG 基础8~16 小时跑通文档到答案的链路
模型部署4~8 小时理解模型如何被稳定调用
应用开发8~16 小时能封装对话、工具和结构化输出
工程化8~16 小时能加入日志、错误处理和部署说明
综合项目16~32 小时完成一个可展示的 LLM 应用

阶段项目路线

第一个项目建议做最小 RAG:准备几篇文档,切分、向量化、检索,并让模型基于资料回答。

第二个项目建议做课程问答助手或个人知识库,加入来源引用、检索结果展示和反馈记录。

第三个项目建议做企业知识库 Demo,加入多轮对话、权限设想、日志和评估样例。

常见卡点

最常见的卡点是以为接入向量数据库就完成了 RAG。真正影响效果的是文档质量、切分策略、检索召回、重排、提示组织和评估数据。

第二个卡点是一上来就追框架。建议先手写最小 RAG,再学 LangChain、LlamaIndex 等框架。

第三个卡点是只做成功 Demo,不处理失败。真实应用必须考虑无答案、检索不到、模型超时、输出格式错误和成本过高。

过关标准

学完本阶段后,你应该能独立完成一个 RAG 应用,能解释数据从文档到答案的完整路径,并能定位效果差可能发生在哪一层。

如果你能做出一个带来源引用、基础日志和简单评估样例的知识库助手,就可以进入 AI Agent 阶段。