Skip to main content

8.0 学习检查表:LLM 应用开发与 RAG

这页当成可打印检查表使用。需要完整讲解时,回到 第 8 章入口页

RAG 作品集证据包

两小时快速通读

时间做什么能说出这句话就停
20 分钟看入口页的 RAG 应用闭环“RAG 答案应该绑定检索证据。”
25 分钟运行 Tiny RAG 脚本“信任答案前,我能先检查 top-k 片段。”
25 分钟浏览 8.1 RAG 基础和文档处理“chunk 大小、重叠和 metadata 会影响检索与引用。”
25 分钟浏览 8.3 API 实践和工具/function calling“LLM 应用需要请求、响应、错误和重试路径。”
25 分钟阅读调试阶梯“我能区分文档、检索、生成、引用和运维失败。”

必须留下的证据

证据最小版本
chunks.jsonl5~10 个 chunk,包含 idsourcetextversion
retrieval_logs.jsonl每个测试问题的 query、top-k chunk ID、score、source
eval_questions.csv至少 10 个固定问题,带期望来源或答案要点
failure_cases.md至少三个失败样本,标注 document、chunking、retrieval、generation、citation 或 deploy
rag_config.mdchunk 大小、overlap、top-k、是否 rerank、Prompt 版本
rag_app_workshop_output.txt8.5.6 实操:第 8 章 RAG 应用完整工作坊 的输出
README.md运行命令、示例问题、带引用答案、评估结果、下一步修复

质量闸门

闸门通过条件
引用每个事实性答案都引用 chunk、source 和 version。
空检索没有证据时,系统会拒绝回答。
回归评估每次修改 chunking、retrieval、reranking 或 Prompt 前后,都跑同一批问题。
运维记录日志包含 query、top-k、Prompt 版本、latency、token cost 和失败标签。

离章问题

  • 你能解释 RAG 和“写更长 Prompt”有什么不同吗?
  • 你能展示一个问题检索到了哪些文档片段吗?
  • 你能说明 chunk metadata 为什么对引用和排障必不可少吗?
  • 检索为空时,你能返回“资料不足”,而不是让模型猜吗?
  • 你能用同一组评估问题比较两个 RAG 版本吗?

如果答案都是可以,就进入第 9 章。第 9 章会把系统从“生成答案”升级成能规划、调用工具、从失败中恢复的 Agent。