跳到主要内容

学前导读:综合项目这一章到底该怎么学

这一章不是继续堆组件,而是把前面学过的知识层、模型层、应用层和工程层真正做成系统。

8 LLM 应用开发与 RAG 的项目和 7 大模型原理、Prompt 与微调不一样。7 更关注模型能力、Prompt、微调和方案选择;8 更关注一个 LLM 应用怎样接入资料、调用模型、组织功能、处理错误、记录日志,并形成可以演示和迭代的产品原型。

这一章在整个课程里的位置

你已经学过 RAG、模型部署、应用开发和工程化。综合项目是这一阶段的出口,要证明你不只是能写一个模型调用,而是能把文档、检索、对话、工具、结构化输出、引用、评估和部署说明组织起来。

这一章真正要解决的问题

这一章要回答五个问题:如何把资料变成可检索知识库;如何让模型基于来源回答而不是凭空发挥;如何把 RAG、Function Calling、多轮对话和结构化输出组织成应用功能;如何处理检索为空、模型超时、格式错误和无答案问题;如何用日志、引用和评估样例证明系统可靠。

新人最容易犯的错误,是把项目理解为“接一个向量数据库就完成了”。真正的 LLM 应用项目要能解释每一层:资料从哪里来,怎样切分,怎样检索,怎样进入 prompt,模型怎样输出,系统怎样校验,用户怎样看到来源,开发者怎样评估效果。

新人推荐学习顺序

建议先做企业知识库问答或课程知识库问答,因为它最能训练 RAG 主链路。然后做智能问答助手,把检索、会话状态和工具调用接成产品功能。接着做 RAG + 微调综合系统,理解知识增强和行为适配怎样组合。最后可以做知识库驱动的课件生成助手,把文档解析、例题抽取、结构化输出和模板化生成放进一个更完整的应用场景。

学这一章时要抓住的主线

这一章的主线可以概括为:LLM 应用项目不是一次生成,而是知识、模型、功能和工程的闭环。

看懂这条线后,你会知道项目展示不能只放最终答案。你还应该展示检索片段、来源引用、失败处理、日志样例、评估问题和下一步改进。

几个项目分别在练什么

项目你真正要练什么
企业知识库问答检索、权限、引用和可追溯回答
RAG + 微调综合系统知识增强和行为适配如何组合
智能问答助手检索、会话状态、工具调用如何串成产品链
知识库驱动的课件生成助手文档解析、例题抽取、结构化输出和模板化文档生成

这一章和后面阶段的关系

这一章是 AI Agent 阶段的前置出口。一个稳定的 LLM 应用已经包含知识、模型、工具、状态和工程化雏形;Agent 会在此基础上继续加入目标驱动、多步规划、工具观察、记忆和安全评估。

如果这一章没学稳,后面常见的问题是:Agent 还没开始做,RAG 和应用层已经不稳定;工具调用没有校验;无答案问题不会处理;系统没有日志和评估;Demo 看起来能回答,但无法解释答案从哪里来。

新人和进阶学习者怎么读

新人第一次学这一章时,先抓住主线和最小可运行例子。你不需要一次理解所有细节,只要能说清楚这一章解决什么问题、输入输出是什么、最小项目怎么跑起来,就可以继续往后走。

有经验的学习者可以把这一章当成查漏补缺和工程化练习:关注边界条件、失败案例、评估方式、代码可复现性,以及它和前后阶段的连接。读完后最好能把本章内容沉淀到自己的作品 README 或实验记录里。

学习时间与难度建议

学习方式建议投入目标
快速浏览20~30 分钟看懂本章解决什么问题,知道后面会用到哪里
最小通关1~2 小时跑通一个最小例子,完成本章小项目出口
深入练习半天~1 天补充错误分析、对比实验或项目 README 记录

本章自测问题

自测问题通过标准
这一章解决什么问题?能用一句话说明它在整门课里的位置
最小输入输出是什么?能说清楚例子需要什么输入,会产生什么结果
常见失败点在哪里?能列出至少一个报错、效果差或理解偏差的原因
学完后能沉淀什么?能把本章产出写进项目 README、实验记录或作品集

本章小项目出口

学完这一章后,建议至少完成一个“带来源引用的知识库助手”。项目需要包含文档导入、切分、向量化、检索、上下文拼接、模型回答、来源展示、无答案处理和简单评估集。

进阶版本可以加入多轮对话、用户反馈、Function Calling、文档解析和模板化导出。作品集版本建议补充架构图、关键代码说明、评估样例、失败案例和部署说明。

项目交付物模板

这一章的项目不要只交一个“能回答问题的 Demo”。为了让作品更像真实 LLM 应用,建议至少包含这些交付物:

交付物说明
项目说明说明目标用户、知识范围、核心问题和不做什么
架构图展示文档解析、切块、检索、模型调用、引用和日志链路
知识库样例展示原始资料、切块结果、metadata 和来源字段
检索日志展示典型问题命中的片段、分数和排序
答案引用最终答案要展示参考来源,不能只给一段生成文本
失败案例至少列出 3 个错例,并判断是切块、检索、上下文还是生成问题
评估样例准备一组固定测试问题,用来比较优化前后效果
部署说明说明如何运行、需要哪些环境变量、如何复现 Demo

这个模板的目的,是让你的项目能被别人看懂、复现和评价,而不是只在你电脑上偶然跑通一次。


作品集检查清单

提交项目前,可以用下面这张表自查:

检查项是否达标
用户能看到答案来自哪些文档片段是 / 否
开发者能看到每次检索命中了什么是 / 否
检索为空时有明确处理,而不是硬编答案是 / 否
输出格式错误时有校验或重试机制是 / 否
至少有一组固定评估问题是 / 否
README 或项目说明里有架构图和运行步骤是 / 否

Debug 侦探案件

案件内容
案件名RAG 找不到证据
案发现场问题明明在文档里,系统却答非所问或引用不支持答案。
侦查步骤先关闭生成,只打印检索结果;检查 chunk、metadata、top-k 和 query。
结案证据retrieval_logs.jsonl、citation_check.csv、失败类型统计。

项目练习不要只保留成功截图。至少挑一个真实失败样本,按“现象、线索、嫌疑原因、侦查步骤、修复动作、回归检查”写进 reports/failure_cases.md,这样项目会更像真实工程作品。

项目交付物标准

每个综合项目都建议按同一套作品集标准交付,而不是只把代码跑通。最小交付物应该包括:一份 README、一条可复现运行命令、一组示例输入输出、一张关键流程图、一次失败样本分析,以及下一步改进计划。

交付物最低要求进阶要求
README写清项目目标、运行方式、依赖和示例增加架构图、设计取舍和复盘
示例输入输出至少保留 1 个完整案例保留成功、失败和边界案例
评估记录写清用什么指标判断效果加入 baseline、对比实验和错误分析
工程记录记录一次环境或接口问题记录日志、成本、耗时和排障过程
展示材料截图或短 GIF 证明能运行做成可讲解的作品集页面

做项目时最重要的不是功能堆得多,而是能讲清楚:你解决了什么问题,系统怎样工作,效果怎么判断,失败时怎么定位,下一版准备怎样改。

过关标准

这一章结束时,你应该能独立完成一个 RAG 或 LLM 应用项目,能解释资料从文档到答案的完整路径,能处理检索为空、模型输出格式错误和无来源回答等常见失败,能用日志和评估样例说明系统效果。

如果你能做出一个带来源引用、基础日志、错误处理、评估样例和部署说明的知识库助手,就达到了 LLM 应用开发阶段的作品集出口标准。

版本路线建议

版本目标交付重点
基础版跑通最小闭环能输入、能处理、能输出,并保留一组示例
标准版形成可展示项目增加配置、日志、错误处理、README 和截图
挑战版接近作品集质量增加评估、对比实验、失败样本分析和下一步路线

建议先完成基础版,不要一开始就追求大而全。每提升一个版本,都要把“新增了什么能力、怎么验证、还有什么问题”写进 README。