8.0 学习检查表:LLM 应用开发与 RAG
这页当成可打印检查表使用。需要完整讲解时,回到 第 8 章入口页。

两小时快速通读
| 时间 | 做什么 | 能说出这句话就停 |
|---|---|---|
| 20 分钟 | 看入口页的 RAG 应用闭环 | “RAG 答案应该绑定检索证据。” |
| 25 分钟 | 运行 Tiny RAG 脚本 | “信任答案前,我能先检查 top-k 片段。” |
| 25 分钟 | 浏览 8.1 RAG 基础和文档处理 | “chunk 大小、重叠和 metadata 会影响检索与引用。” |
| 25 分钟 | 浏览 8.3 API 实践和工具/function calling | “LLM 应用需要请求、响应、错误和重试路径。” |
| 25 分钟 | 阅读调试阶梯 | “我能区分文档、检索、生成、引用和运维失败。” |
必须留下的证据
| 证据 | 最小版本 |
|---|---|
chunks.jsonl | 5~10 个 chunk,包含 id、source、text、version |
retrieval_logs.jsonl | 每个测试问题的 query、top-k chunk ID、score、source |
eval_questions.csv | 至少 10 个固定问题,带期望来源或答案要点 |
failure_cases.md | 至少三个失败样本,标注 document、chunking、retrieval、generation、citation 或 deploy |
rag_config.md | chunk 大小、overlap、top-k、是否 rerank、Prompt 版本 |
rag_app_workshop_output.txt | 8.5.6 实操:第 8 章 RAG 应用完整工作坊 的输出 |
README.md | 运行命令、示例问题、带引用答案、评估结果、下一步修复 |
质量闸门
| 闸门 | 通过条件 |
|---|---|
| 引用 | 每个事实性答案都引用 chunk、source 和 version。 |
| 空检索 | 没有证据时,系统会拒绝回答。 |
| 回归评估 | 每次修改 chunking、retrieval、reranking 或 Prompt 前后,都跑同一批问题。 |
| 运维记录 | 日志包含 query、top-k、Prompt 版本、latency、token cost 和失败标签。 |
离章问题
- 你能解释 RAG 和“写更长 Prompt”有什么不同吗?
- 你能展示一个问题检索到了哪些文档片段吗?
- 你能说明 chunk metadata 为什么对引用和排障必不可少吗?
- 检索为空时,你能返回“资料不足”,而不是让模型猜吗?
- 你能用同一组评估问题比较两个 RAG 版本吗?
如果答案都是可以,就进入第 9 章。第 9 章会把系统从“生成答案”升级成能规划、调用工具、从失败中恢复的 Agent。