跳到主要内容

常见概念别混表

本节定位

这一页不是正式知识点教程,而是一张“概念地图”。当你在课程里看到 API、SDK、模型、训练、推理、Prompt、RAG、Agent、Token、Embedding 等词时,可以先来这里快速对照,避免把相近概念混在一起。

怎么使用这张表

新人第一次阅读时,不需要记住所有术语,只要先建立大概边界:哪个是工具,哪个是模型,哪个是流程,哪个是应用架构。有经验的学习者可以把它当作术语校准表,后面做项目说明、技术文档或面试表达时,尽量用更准确的词。


开发与调用相关

容易混淆的概念简单理解关键区别
API程序对外提供的调用入口你按约定发送请求,它返回结果
SDK封装好的开发工具包SDK 通常帮你更方便地调用 API
Library(库)可复用代码集合你在自己的程序里主动调用它
Framework(框架)帮你组织应用结构的骨架你通常要按框架规则写代码
CLI命令行工具通过终端输入命令使用
Web API通过 HTTP 暴露的 API常用于前后端、模型服务和外部系统连接

举例来说,OpenAI 或 Anthropic 的模型能力通常通过 Web API 暴露;Python SDK 则把 HTTP 请求细节封装起来,让你用几行 Python 代码完成调用。


模型与服务相关

容易混淆的概念简单理解关键区别
模型学到参数的 AI 系统核心模型本身负责推理或生成
模型服务把模型包装成可调用服务负责接口、并发、鉴权、日志和部署
推理使用模型得到输出不改变模型参数
训练用数据更新模型参数需要数据、算力、损失函数和优化
微调在已有模型基础上继续训练通常用于适配领域、格式或任务
部署让服务能稳定被别人访问包含运行环境、监控、扩缩容和安全

很多初学者会把“调用模型”和“训练模型”混在一起。调用模型像使用一个已经做好的工具,训练模型则是重新塑造工具本身。


大模型应用相关

容易混淆的概念简单理解关键区别
Prompt给模型的输入和任务说明影响模型当前这次怎么回答
System Prompt更高优先级的行为设定常用于设定角色、边界和输出风格
Few-shot在提示里给少量示例通过示例教模型模仿格式或思路
Structured Output要求模型输出固定结构常用于 JSON、表格、字段抽取
Function Calling让模型选择并填写工具参数模型不直接执行工具,系统负责执行
Tool Use模型通过外部工具完成任务包含搜索、代码、数据库、文件等工具

Prompt 更像“这次怎么问”,工具调用更像“模型决定下一步要用哪个外部能力”。两者可以一起使用,但解决的问题不同。


RAG、微调和 Agent

容易混淆的概念适合解决的问题不适合解决的问题
Prompt任务定义不清、输出格式不稳、需要更好表达需求让模型凭空知道私有知识
RAG需要基于外部文档、私有知识或最新资料回答改变模型本身能力或风格
微调需要模型稳定掌握特定格式、风格或领域任务动态读取大量最新资料
Agent多步骤、需要工具、需要根据中间结果调整路线的任务固定、简单、高风险且必须完全可控的流程
Workflow步骤固定、规则清晰的自动化流程开放探索、路径不确定的任务

一个实用判断是:如果问题只是问法不好,先改 Prompt;如果缺知识,优先 RAG;如果格式和风格长期不稳定,再考虑微调;如果任务需要多步行动和工具选择,再考虑 Agent。


数据与向量相关

容易混淆的概念简单理解关键区别
Token模型处理文本的基本片段可能是字、词、子词或符号片段
Embedding把文本、图片等表示成向量方便计算相似度和检索
向量数据库存储并检索向量的系统常用于 RAG 的相似内容召回
上下文窗口模型一次能看到的输入范围放不进去的内容模型无法直接使用
Chunk文档切分后的片段RAG 通常按片段检索,而不是整篇文档
Metadata附加信息如来源、标题、页码、权限、时间等

RAG 里常见链路是:文档先切成 Chunk,再转成 Embedding,写入向量数据库;用户提问时也转成向量,检索相似 Chunk,再放进上下文窗口让模型回答。


学习建议

如果你是新人,先不要追求一次记住所有术语。每遇到一个新项目,就回到这张表问三个问题:我现在是在调用服务,还是训练模型;我是在补知识,还是改模型行为;我需要固定流程,还是需要 Agent 自己规划。

如果你已经有经验,可以进一步训练自己的技术表达:写项目 README 时尽量明确说明“我用了哪个模型服务、通过哪个 API 调用、是否使用 RAG、是否使用工具调用、评估指标是什么、失败边界在哪里”。这会让你的项目更像真实工程交付,而不是只跑通 Demo。