学前导读：综合项目这一章到底该怎么学

这一章不是继续堆组件，而是把前面学过的知识层、模型层、应用层和工程层真正做成系统。

8 LLM 应用开发与 RAG 的项目和 7 大模型原理、Prompt 与微调不一样。7 更关注模型能力、Prompt、微调和方案选择；8 更关注一个 LLM 应用怎样接入资料、调用模型、组织功能、处理错误、记录日志，并形成可以演示和迭代的产品原型。

这一章在整个课程里的位置

你已经学过 RAG、模型部署、应用开发和工程化。综合项目是这一阶段的出口，要证明你不只是能写一个模型调用，而是能把文档、检索、对话、工具、结构化输出、引用、评估和部署说明组织起来。

这一章真正要解决的问题

这一章要回答五个问题：如何把资料变成可检索知识库；如何让模型基于来源回答而不是凭空发挥；如何把 RAG、Function Calling、多轮对话和结构化输出组织成应用功能；如何处理检索为空、模型超时、格式错误和无答案问题；如何用日志、引用和评估样例证明系统可靠。

新人最容易犯的错误，是把项目理解为“接一个向量数据库就完成了”。真正的 LLM 应用项目要能解释每一层：资料从哪里来，怎样切分，怎样检索，怎样进入 prompt，模型怎样输出，系统怎样校验，用户怎样看到来源，开发者怎样评估效果。

新人推荐学习顺序

建议先做企业知识库问答或课程知识库问答，因为它最能训练 RAG 主链路。然后做智能问答助手，把检索、会话状态和工具调用接成产品功能。接着做 RAG + 微调综合系统，理解知识增强和行为适配怎样组合。最后可以做知识库驱动的课件生成助手，把文档解析、例题抽取、结构化输出和模板化生成放进一个更完整的应用场景。

学这一章时要抓住的主线

这一章的主线可以概括为：LLM 应用项目不是一次生成，而是知识、模型、功能和工程的闭环。

看懂这条线后，你会知道项目展示不能只放最终答案。你还应该展示检索片段、来源引用、失败处理、日志样例、评估问题和下一步改进。

几个项目分别在练什么

项目	你真正要练什么
企业知识库问答	检索、权限、引用和可追溯回答
RAG + 微调综合系统	知识增强和行为适配如何组合
智能问答助手	检索、会话状态、工具调用如何串成产品链
知识库驱动的课件生成助手	文档解析、例题抽取、结构化输出和模板化文档生成

这一章和后面阶段的关系

这一章是 AI Agent 阶段的前置出口。一个稳定的 LLM 应用已经包含知识、模型、工具、状态和工程化雏形；Agent 会在此基础上继续加入目标驱动、多步规划、工具观察、记忆和安全评估。

如果这一章没学稳，后面常见的问题是：Agent 还没开始做，RAG 和应用层已经不稳定；工具调用没有校验；无答案问题不会处理；系统没有日志和评估；Demo 看起来能回答，但无法解释答案从哪里来。

新人和进阶学习者怎么读

新人第一次学这一章时，先抓住主线和最小可运行例子。你不需要一次理解所有细节，只要能说清楚这一章解决什么问题、输入输出是什么、最小项目怎么跑起来，就可以继续往后走。

有经验的学习者可以把这一章当成查漏补缺和工程化练习：关注边界条件、失败案例、评估方式、代码可复现性，以及它和前后阶段的连接。读完后最好能把本章内容沉淀到自己的作品 README 或实验记录里。

学习时间与难度建议

学习方式	建议投入	目标
快速浏览	20～30 分钟	看懂本章解决什么问题，知道后面会用到哪里
最小通关	1～2 小时	跑通一个最小例子，完成本章小项目出口
深入练习	半天～1 天	补充错误分析、对比实验或项目 README 记录

本章自测问题

自测问题	通过标准
这一章解决什么问题？	能用一句话说明它在整门课里的位置
最小输入输出是什么？	能说清楚例子需要什么输入，会产生什么结果
常见失败点在哪里？	能列出至少一个报错、效果差或理解偏差的原因
学完后能沉淀什么？	能把本章产出写进项目 README、实验记录或作品集

本章小项目出口

学完这一章后，建议至少完成一个“带来源引用的知识库助手”。项目需要包含文档导入、切分、向量化、检索、上下文拼接、模型回答、来源展示、无答案处理和简单评估集。

进阶版本可以加入多轮对话、用户反馈、Function Calling、文档解析和模板化导出。作品集版本建议补充架构图、关键代码说明、评估样例、失败案例和部署说明。

项目交付物模板

这一章的项目不要只交一个“能回答问题的 Demo”。为了让作品更像真实 LLM 应用，建议至少包含这些交付物：

交付物	说明
项目说明	说明目标用户、知识范围、核心问题和不做什么
架构图	展示文档解析、切块、检索、模型调用、引用和日志链路
知识库样例	展示原始资料、切块结果、metadata 和来源字段
检索日志	展示典型问题命中的片段、分数和排序
答案引用	最终答案要展示参考来源，不能只给一段生成文本
失败案例	至少列出 3 个错例，并判断是切块、检索、上下文还是生成问题
评估样例	准备一组固定测试问题，用来比较优化前后效果
部署说明	说明如何运行、需要哪些环境变量、如何复现 Demo

这个模板的目的，是让你的项目能被别人看懂、复现和评价，而不是只在你电脑上偶然跑通一次。

作品集检查清单

提交项目前，可以用下面这张表自查：

检查项	是否达标
用户能看到答案来自哪些文档片段	是 / 否
开发者能看到每次检索命中了什么	是 / 否
检索为空时有明确处理，而不是硬编答案	是 / 否
输出格式错误时有校验或重试机制	是 / 否
至少有一组固定评估问题	是 / 否
README 或项目说明里有架构图和运行步骤	是 / 否

Debug 侦探案件

案件	内容
案件名	RAG 找不到证据
案发现场	问题明明在文档里，系统却答非所问或引用不支持答案。
侦查步骤	先关闭生成，只打印检索结果；检查 chunk、metadata、top-k 和 query。
结案证据	retrieval_logs.jsonl、citation_check.csv、失败类型统计。

项目练习不要只保留成功截图。至少挑一个真实失败样本，按“现象、线索、嫌疑原因、侦查步骤、修复动作、回归检查”写进 reports/failure_cases.md，这样项目会更像真实工程作品。

项目交付物标准

每个综合项目都建议按同一套作品集标准交付，而不是只把代码跑通。最小交付物应该包括：一份 README、一条可复现运行命令、一组示例输入输出、一张关键流程图、一次失败样本分析，以及下一步改进计划。

交付物	最低要求	进阶要求
README	写清项目目标、运行方式、依赖和示例	增加架构图、设计取舍和复盘
示例输入输出	至少保留 1 个完整案例	保留成功、失败和边界案例
评估记录	写清用什么指标判断效果	加入 baseline、对比实验和错误分析
工程记录	记录一次环境或接口问题	记录日志、成本、耗时和排障过程
展示材料	截图或短 GIF 证明能运行	做成可讲解的作品集页面

做项目时最重要的不是功能堆得多，而是能讲清楚：你解决了什么问题，系统怎样工作，效果怎么判断，失败时怎么定位，下一版准备怎样改。

过关标准

这一章结束时，你应该能独立完成一个 RAG 或 LLM 应用项目，能解释资料从文档到答案的完整路径，能处理检索为空、模型输出格式错误和无来源回答等常见失败，能用日志和评估样例说明系统效果。

如果你能做出一个带来源引用、基础日志、错误处理、评估样例和部署说明的知识库助手，就达到了 LLM 应用开发阶段的作品集出口标准。

版本路线建议

版本	目标	交付重点
基础版	跑通最小闭环	能输入、能处理、能输出，并保留一组示例
标准版	形成可展示项目	增加配置、日志、错误处理、README 和截图
挑战版	接近作品集质量	增加评估、对比实验、失败样本分析和下一步路线

建议先完成基础版，不要一开始就追求大而全。每提升一个版本，都要把“新增了什么能力、怎么验证、还有什么问题”写进 README。

这一章在整个课程里的位置​

这一章真正要解决的问题​

新人推荐学习顺序​

学这一章时要抓住的主线​

几个项目分别在练什么​

这一章和后面阶段的关系​

新人和进阶学习者怎么读​

学习时间与难度建议​

本章自测问题​

本章小项目出口​

项目交付物模板​

作品集检查清单​

Debug 侦探案件​

项目交付物标准​

过关标准​

版本路线建议​