2025-2026 AI 应用技术地图
本节定位
这一页是整套课程后半段的“现代技术总览”。你会看到 2025~2026 年 AI 应用工程的主线已经从“会调用大模型”升级为“能构建可检索、可行动、可评估、可监控、可部署的 AI 系统”。
新人阅读这一页时,不需要记住所有新名词,只要先建立一张地图:RAG 解决知识接入,Agent 解决多步骤行动,多模态解决真实世界输入输出,模型工程解决成本和部署,LLMOps / RAGOps / AgentOps 解决长期运行和质量控制。
现代 AI 系统不只是一个模型
早期大模型应用常见形态是:用户输入问题,后端调用一个模型,模型返回答案。但真实产品很快会遇到问题:模型不知道私有资料,回答没有来源,工具调用不稳定,成本不可控,生成内容无法审核,线上失败无 法复盘。
所以现代 AI 应用更像一个系统,而不是一个单点模型。
看懂这两段图,就能理解为什么课程后半段要从 Prompt 进入 RAG、Agent、多模态、部署和评估。真正的能力不是“调一次模型成功”,而是让系统在不同用户、不同资料、不同失败场景下仍然能被检查和改进。
RAGOps:让知识库不是一次性 Demo
RAGOps 可以理解成“围绕 RAG 系统的运行、评估和维护方法”。普通 RAG 只关心能不能检索并回答;RAGOps 还关心文档是否更新、索引是否过期、召回是否稳定、引用是否可信、成本和延迟是否可接受。
现代 RAG 常见技术包括 Hybrid Search、Reranking、Query Rewrite、Multi-query Retrieval、GraphRAG、Agentic RAG 和 Multimodal RAG。它们解决的问题不同:Hybrid Search 避免纯向量检索漏掉关键词,Reranking 让召回结果重新排序,Query Rewrite 让含糊问题变得更适合检索,GraphRAG 适合跨文档实体关系,Agentic RAG 让系统能多轮判断还要不要继续查资料,多模态 RAG 则把图片、表格、PDF 和截图纳入知识来源。
这一部分会主要落在第 8 站:LLM 应用开发与 RAG。
AgentOps:让智能体能被追踪和控制
AgentOps 可以理解成“围绕 Agent 的执行轨迹、 工具调用、权限、安全、评估和部署的工程方法”。一个 Agent 不应该只是看起来会行动,还要知道它为什么行动、调用了什么工具、花了多少成本、失败时怎么恢复、什么时候需要人工确认。
现代 Agent 的重点不是完全放任模型自由发挥,而是把工作流、工具协议和安全边界结合起来。MCP 这类协议让模型和工具、文件、数据库、业务系统之间的连接更标准;Agentic Workflow 让开放任务和固定流程结合;Human-in-the-loop 让高风险步骤保留人工确认;Agent Observability 记录计划、工具调用、结果和错误。
这一部分会主要落在第 9 站:AI Agent 与智能体系统。
多模态 AI:从文字助手到真实世界助手
多模态 AI 的重点不是“生成图片很漂亮”,而是让 AI 能处理真实世界里的多种输入输出:截图、图表、PDF、文档页面、语音、视频、图片和文本。现代应用里,多模态能力经常和 RAG、Agent、内容生成、审核工作流结合。
例如,一个课程资料助手可以读取 Markdown,也可以理解课件截图和 PDF 表格;一个研究 Agent 可以看网页截图、提取图表信息、调用工具生成报告;一个 AIGC 工作台可以从主题生成文案、图片提示词、分镜脚本、语音稿和审核清单。
这一部分会主要落在第 12 站:AIGC 与多模态,也会和第 8 站的文档解析、多模态 RAG,以及第 9 站的多模态 Agent 产生连接。
模型工程 :不是永远调用最强模型
真实项目不一定永远使用最强、最贵、最大的模型。很多场景需要在效果、延迟、成本、隐私和部署复杂度之间取平衡。
现代模型工程会考虑小模型、模型路由、量化、蒸馏、LoRA / QLoRA、本地部署、混合部署、缓存、批处理和推理优化。一个系统可能会用便宜模型处理简单任务,用强模型处理复杂推理,用视觉模型处理图片,用本地模型处理隐私数据。
这一部分会落在第 6 站的深度学习基础、第 7 站的大模型原理与微调、第 8 站的模型部署和工程化实践里。
LLMOps:把大模型应用当成长期运行的软件
LLMOps 关注的是大模型应用的全生命周期:Prompt 版本管理、评估集、自动化测试、日志、Trace、Token 成本、延迟、模型版本变化、权限控制、内容安全和上线回滚。
如果没有 LLMOps,一个应用可能今天回答很好,明天因为文档更新、Prompt 改动、模型版本变化或用户问题变化而变差,却没人知道原因。课程里的工程化部分会逐步把这些能力加入项目:先记录日志,再设计评估集,再加入监控和成本统计,最后形成上线检查清单。