Skip to main content

A.9 学习资源速查表

AI 项目速查总览

AI 项目速查排错索引

做项目时查这一页,不需要从头读到尾。

环境检查

python --version
which python
pip --version
pip list
pwd
ls

文档站点:

npm install
npm run start
npm run build

NVIDIA GPU:

nvidia-smi

先做基线

任务优先尝试
表格分类/回归线性模型或树模型
文本分类TF-IDF + LogisticRegression
图像分类迁移学习
命名实体识别规则/词典 baseline,再上序列模型
文档问答关键词/BM25 检索,再上 RAG
Agent 工具调用单 Agent + 一个安全工具

指标

任务先看哪些指标
类别均衡分类Accuracy、F1
类别不均衡分类Precision、Recall、F1、混淆矩阵
回归MAE、RMSE、残差复盘
检索 / RAGHit@K、MRR、引用准确率、人工复查
Agent成功率、工具错误、成本、trace 复盘

训练警报

现象先检查
loss 不下降标签、loss 函数、学习率、输入格式
训练好、验证差过拟合、数据泄漏、分布不一致
accuracy 不变特征弱、标签错、模型没学到
GPU OOMbatch size、输入长度、模型大小
结果不稳定随机种子、数据太少、划分不一致

RAG 检查表

  1. 文档是否正确切分?
  2. 检索能否召回正确 chunk?
  3. 答案是否包含来源?
  4. 答案是否真的使用了检索内容?
  5. 是否有权限过滤和无法回答策略?

Agent 检查表

  1. 从单轮问答开始。
  2. 加一个工具。
  3. 加严格参数 schema。
  4. 加日志和 trace 回放。
  5. 加权限边界和停止条件。

Prompt 模板

你是 ____。
你的任务是 ____。
输入:
输出格式:
约束:
如果信息不足,请明确说明。

最小训练循环

data = [(1.0, 2.0), (2.0, 4.0), (3.0, 6.0)]
w = 0.0
lr = 0.01

for epoch in range(3):
total_loss = 0.0
for x, y in data:
pred = w * x
error = pred - y
total_loss += error * error
grad = 2 * error * x
w -= lr * grad
print(f"epoch={epoch} w={w:.3f} loss={total_loss:.3f}")

预期输出:

epoch=0 w=0.521 loss=48.630
epoch=1 w=0.907 loss=26.580
epoch=2 w=1.192 loss=14.528

按这个顺序读:数据 -> 预测 -> 损失 -> 梯度 -> 参数更新。