阶段学习任务单：LLM 应用开发与 RAG

这个阶段的目标是让你能把大模型接入真实应用，而不是只会在聊天框里提问。你需要掌握 API 调用、提示词、文档处理、向量检索、答案引用、评估和工程化部署。

本阶段必须完成的任务

本阶段对应 AI 学习助手的 v0.8 课程问答助手。它应该能读取课程 Markdown，建立索引，回答学习者问题，并给出引用来源。这个版本是贯穿项目从“学习记录工具”升级为“AI 助手”的关键节点。

建议最小功能包括：导入课程文档、按标题和正文切分、保存元数据、检索相关片段、生成回答、展示引用路径、记录问题和答案。标准版本再加入评估集、失败样本分析和配置化参数。

常见问题包括文档切分太碎或太大、metadata 丢失、embedding 模型和语言不匹配、检索命中但答案不用来源、答案看似正确但引用不支持、上下文太长导致成本和延迟过高。排查时要把检索结果和生成答案分开看。

学完后，你应该能回答这些问题：RAG 解决了大模型的什么限制，chunk 大小会影响什么，embedding 和关键词检索有什么区别，为什么答案必须有引用，如何判断一次 RAG 失败是检索问题还是生成问题。