跳到主要内容

常见概念别混表

本节定位

这一页不是正式知识点教程，而是一张“概念地图”。当你在课程里看到 API、SDK、模型、训练、推理、Prompt、RAG、Agent、Token、Embedding 等词时，可以先来这里快速对照，避免把相近概念混在一起。

怎么使用这张表

新人第一次阅读时，不需要记住所有术语，只要先建立大概边界：哪个是工具，哪个是模型，哪个是流程，哪个是应用架构。有经验的学习者可以把它当作术语校准表，后面做项目说明、技术文档或面试表达时，尽量用更准确的词。

开发与调用相关

容易混淆的概念	简单理解	关键区别
API	程序对外提供的调用入口	你按约定发送请求，它返回结果
SDK	封装好的开发工具包	SDK 通常帮你更方便地调用 API
Library（库）	可复用代码集合	你在自己的程序里主动调用它
Framework（框架）	帮你组织应用结构的骨架	你通常要按框架规则写代码
CLI	命令行工具	通过终端输入命令使用
Web API	通过 HTTP 暴露的 API	常用于前后端、模型服务和外部系统连接

举例来说，OpenAI 或 Anthropic 的模型能力通常通过 Web API 暴露；Python SDK 则把 HTTP 请求细节封装起来，让你用几行 Python 代码完成调用。

模型与服务相关

容易混淆的概念	简单理解	关键区别
模型	学到参数的 AI 系统核心	模型本身负责推理或生成
模型服务	把模型包装成可调用服务	负责接口、并发、鉴权、日志和部署
推理	使用模型得到输出	不改变模型参数
训练	用数据更新模型参数	需要数据、算力、损失函数和优化
微调	在已有模型基础上继续训练	通常用于适配领域、格式或任务
部署	让服务能稳定被别人访问	包含运行环境、监控、扩缩容和安全

很多初学者会把“调用模型”和“训练模型”混在一起。调用模型像使用一个已经做好的工具，训练模型则是重新塑造工具本身。

大模型应用相关

容易混淆的概念	简单理解	关键区别
Prompt	给模型的输入和任务说明	影响模型当前这次怎么回答
System Prompt	更高优先级的行为设定	常用于设定角色、边界和输出风格
Few-shot	在提示里给少量示例	通过示例教模型模仿格式或思路
Structured Output	要求模型输出固定结构	常用于 JSON、表格、字段抽取
Function Calling	让模型选择并填写工具参数	模型不直接执行工具，系统负责执行
Tool Use	模型通过外部工具完成任务	包含搜索、代码、数据库、文件等工具

Prompt 更像“这次怎么问”，工具调用更像“模型决定下一步要用哪个外部能力”。两者可以一起使用，但解决的问题不同。

RAG、微调和 Agent

容易混淆的概念	适合解决的问题	不适合解决的问题
Prompt	任务定义不清、输出格式不稳、需要更好表达需求	让模型凭空知道私有知识
RAG	需要基于外部文档、私有知识或最新资料回答	改变模型本身能力或风格
微调	需要模型稳定掌握特定格式、风格或领域任务	动态读取大量最新资料
Agent	多步骤、需要工具、需要根据中间结果调整路线的任务	固定、简单、高风险且必须完全可控的流程
Workflow	步骤固定、规则清晰的自动化流程	开放探索、路径不确定的任务

一个实用判断是：如果问题只是问法不好，先改 Prompt；如果缺知识，优先 RAG；如果格式和风格长期不稳定，再考虑微调；如果任务需要多步行动和工具选择，再考虑 Agent。

数据与向量相关

容易混淆的概念	简单理解	关键区别
Token	模型处理文本的基本片段	可能是字、词、子词或符号片段
Embedding	把文本、图片等表示成向量	方便计算相似度和检索
向量数据库	存储并检索向量的系统	常用于 RAG 的相似内容召回
上下文窗口	模型一次能看到的输入范围	放不进去的内容模型无法直接使用
Chunk	文档切分后的片段	RAG 通常按片段检索，而不是整篇文档
Metadata	附加信息	如来源、标题、页码、权限、时间等

RAG 里常见链路是：文档先切成 Chunk，再转成 Embedding，写入向量数据库；用户提问时也转成向量，检索相似 Chunk，再放进上下文窗口让模型回答。

学习建议

如果你是新人，先不要追求一次记住所有术语。每遇到一个新项目，就回到这张表问三个问题：我现在是在调用服务，还是训练模型；我是在补知识，还是改模型行为；我需要固定流程，还是需要 Agent 自己规划。

如果你已经有经验，可以进一步训练自己的技术表达：写项目 README 时尽量明确说明“我用了哪个模型服务、通过哪个 API 调用、是否使用 RAG、是否使用工具调用、评估指标是什么、失败边界在哪里”。这会让你的项目更像真实工程交付，而不是只跑通 Demo。

本节定位
怎么使用这张表
开发与调用相关
模型与服务相关
大模型应用相关
RAG、微调和 Agent
数据与向量相关
学习建议