8.0 学习检查表：LLM 应用开发与 RAG

这页当成可打印检查表使用。需要完整讲解时，回到第 8 章入口页。

RAG 作品集证据包

两小时快速通读

时间	做什么	能说出这句话就停
20 分钟	看入口页的 RAG 应用闭环	“RAG 答案应该绑定检索证据。”
25 分钟	运行 Tiny RAG 脚本	“信任答案前，我能先检查 top-k 片段。”
25 分钟	浏览 8.1 RAG 基础和文档处理	“chunk 大小、重叠和 metadata 会影响检索与引用。”
25 分钟	浏览 8.3 API 实践和工具/function calling	“LLM 应用需要请求、响应、错误和重试路径。”
25 分钟	阅读调试阶梯	“我能区分文档、检索、生成、引用和运维失败。”

证据	最小版本
`chunks.jsonl`	5～10 个 chunk，包含 `id`、`source`、`text`、`version`
`retrieval_logs.jsonl`	每个测试问题的 query、top-k chunk ID、score、source
`eval_questions.csv`	至少 10 个固定问题，带期望来源或答案要点
`failure_cases.md`	至少三个失败样本，标注 document、chunking、retrieval、generation、citation 或 deploy
`rag_config.md`	chunk 大小、overlap、top-k、是否 rerank、Prompt 版本
`rag_app_workshop_output.txt`	8.5.6 实操：第 8 章 RAG 应用完整工作坊的输出
`README.md`	运行命令、示例问题、带引用答案、评估结果、下一步修复

闸门	通过条件
引用	每个事实性答案都引用 chunk、source 和 version。
空检索	没有证据时，系统会拒绝回答。
回归评估	每次修改 chunking、retrieval、reranking 或 Prompt 前后，都跑同一批问题。
运维记录	日志包含 query、top-k、Prompt 版本、latency、token cost 和失败标签。

如果答案都是可以，就进入第 9 章。第 9 章会把系统从“生成答案”升级成能规划、调用工具、从失败中恢复的 Agent。