阶段学习任务单:LLM 应用开发与 RAG
这个阶段的目标是让你能把大模型接入真实应用,而不是只会在聊天框里提问。你需要掌握 API 调用、提示词、文档处理、向量检索、答案引用、评估和工程化部署 。
本阶段必须完成的任务
| 任务 | 产出物 | 通过标准 |
|---|---|---|
| 跑通 LLM API 调用 | 一个最小调用脚本 | 能处理 key、请求、响应、异常和重试 |
| 完成文档处理 | 一份切分与清洗记录 | 能说明 chunk 大小、重叠、元数据和来源 |
| 建立向量检索 | 一个最小检索 Demo | 能从问题检索到相关文档片段 |
| 完成 RAG 问答 | 一个课程问答原型 | 回答包含来源引用,并能说明检索依据 |
| 完成 RAG 评估 | 一份测试集与评估表 | 能记录命中率、答案质量、引用质量和失败样本 |
推荐学习顺序
先跑通模型 API,再处理文档和 embedding,然后建立向量检索,最后把检索结果和生成模型连接起来。不要一开始就引入复杂框架,先用最小代码理解 RAG 的输入输出边界。
RAG 的关键不是“接了向量数据库”,而是能解释为什么这段文档被检索出来、答案是否真的由来源支持、哪些问题检索不到、哪些答案可能幻觉。