跳到主要内容

学前导读:RAG 这一章到底在学什么

这一章解决的是:当模型知识不够新、不够全、不够贴合你的业务资料时,怎样把外部知识稳定接进回答链路。

RAG 不只是“接一个向量数据库”。它真正训练的是一种大模型应用开发思维:哪些知识应该放进模型参数,哪些知识应该放在外部文档里,用户提问时怎样检索相关资料,又怎样让模型基于资料而不是凭空回答。

这一章在整个课程里的位置

你已经在第八 A 阶段学过大模型原理、Prompt、微调和对齐。到第八 B 阶段,课程开始从“理解模型能力”进入“组织应用系统”。RAG 是这条应用主线的第一块关键地基。

如果说 Prompt 是让模型更好地理解任务,微调是调整模型的行为习惯,那么 RAG 更像是给模型接上一个可更新、可追溯、可管理的知识库。

这一章真正要解决的问题

这一章要回答五个问题:文档为什么不能直接整篇塞给模型;切分、清洗和元数据为什么会影响检索质量;Embedding 和向量数据库到底在做什么;召回、重排、过滤和上下文拼接怎样影响最终回答;如何判断一个 RAG 系统效果好不好。

新人最容易误解 RAG 的地方,是以为“能检索出来”就等于“回答可靠”。真实情况是,RAG 的效果往往卡在文档质量、切分粒度、召回覆盖、重排准确性、提示组织和答案评估上。

新人推荐学习顺序

建议先理解 RAG 的最小闭环:用户提问后,系统先检索资料,再把资料和问题一起交给模型回答。然后学习文档处理和切分,知道知识进入系统前需要清洗、分块和添加元数据。接着学习 Embedding 与向量数据库,理解相似度检索为什么能找到相关片段。最后再看检索优化、重排和评估,因为这些决定了系统能不能从 Demo 走向可用产品。

学这一章时要抓住的主线

这一章的主线可以概括为:把“资料”变成“可检索知识”,再把“检索结果”变成“可引用答案”。

前半段重点是把原始资料变成可检索的知识索引;后半段才围绕用户问题进行召回、重排、回答和引用。

看懂这条链路后,你会知道 RAG 项目调优不是只改 prompt。检索不到时要查文档解析、切分和召回;检索到了但答案不对时要查重排、上下文组织和生成提示;答案看似正确但不可验证时要补来源引用和评估样例。

这一章和后面章节的关系

RAG 是后面课程问答助手、个人知识库、企业知识库和 Agent 工具调用的基础。模型部署章节会告诉你模型如何稳定被调用,应用开发章节会把 RAG 放进对话、文件上传和 API 里,工程化章节会继续补日志、错误处理、评估和部署。

如果这一章没学稳,后面常见的问题是:知识库 Demo 能跑,但问稍复杂的问题就答非所问;引用来源不稳定;用户问无答案问题时模型硬编;系统不知道是检索失败、模型失败还是文档质量失败。

新人和进阶学习者怎么读

新人第一次学这一章时,先抓住主线和最小可运行例子。你不需要一次理解所有细节,只要能说清楚这一章解决什么问题、输入输出是什么、最小项目怎么跑起来,就可以继续往后走。

有经验的学习者可以把这一章当成查漏补缺和工程化练习:关注边界条件、失败案例、评估方式、代码可复现性,以及它和前后阶段的连接。读完后最好能把本章内容沉淀到自己的作品 README 或实验记录里。

学习时间与难度建议

学习方式建议投入目标
快速浏览20~30 分钟看懂本章解决什么问题,知道后面会用到哪里
最小通关1~2 小时跑通一个最小例子,完成本章小项目出口
深入练习半天~1 天补充错误分析、对比实验或项目 README 记录

本章自测问题

自测问题通过标准
这一章解决什么问题?能用一句话说明它在整门课里的位置
最小输入输出是什么?能说清楚例子需要什么输入,会产生什么结果
常见失败点在哪里?能列出至少一个报错、效果差或理解偏差的原因
学完后能沉淀什么?能把本章产出写进项目 README、实验记录或作品集

本章小项目出口

学完这一章后,建议做一个最小课程知识库问答。准备 3 到 5 篇课程文档,完成文档读取、切分、向量化、检索、上下文拼接、模型回答和来源展示。项目不需要复杂界面,但必须能展示检索到的片段和答案来源。

最小交付物建议包含:docs/ 中的 3~5 篇 Markdown 文档,rag_demo.py 或 notebook,至少 10 条固定测试问题,检索 top-k 片段打印结果,以及一张“问题 → 命中文档 → 答案是否正确”的评估表。

query = "RAG 为什么需要来源引用?"
for i, chunk in enumerate(top_k_chunks, start=1):
print(i, chunk["source"], chunk["text"][:80])

如果想进一步提升,可以加入一个小评估集,例如 10 个问题,每个问题标注期望命中的文档和理想答案,用来观察切分和检索策略调整前后的变化。

过关标准

这一章结束时,你应该能解释 RAG 从文档到答案的完整路径,能说清楚 chunk、embedding、向量数据库、召回、重排、上下文和引用分别在做什么,能判断一个 RAG 效果差大概卡在哪一层。

如果你能做出一个带来源引用、检索片段展示和简单评估样例的最小知识库助手,就达到了进入 LLM 应用开发和 Agent 阶段的基础要求。