A.9 学习资源速查表

AI 项目速查总览

AI 项目速查排错索引

做项目时查这一页，不需要从头读到尾。

环境检查

python --version
which python
pip --version
pip list
pwd
ls

文档站点：

npm install
npm run start
npm run build

NVIDIA GPU：

nvidia-smi

先做基线

任务	优先尝试
表格分类/回归	线性模型或树模型
文本分类	`TF-IDF + LogisticRegression`
图像分类	迁移学习
命名实体识别	规则/词典 baseline，再上序列模型
文档问答	关键词/BM25 检索，再上 RAG
Agent 工具调用	单 Agent + 一个安全工具

指标

任务	先看哪些指标
类别均衡分类	Accuracy、F1
类别不均衡分类	Precision、Recall、F1、混淆矩阵
回归	MAE、RMSE、残差复盘
检索 / RAG	Hit@K、MRR、引用准确率、人工复查
Agent	成功率、工具错误、成本、trace 复盘

训练警报

现象	先检查
loss 不下降	标签、loss 函数、学习率、输入格式
训练好、验证差	过拟合、数据泄漏、分布不一致
accuracy 不变	特征弱、标签错、模型没学到
GPU OOM	batch size、输入长度、模型大小
结果不稳定	随机种子、数据太少、划分不一致

RAG 检查表

文档是否正确切分？
检索能否召回正确 chunk？
答案是否包含来源？
答案是否真的使用了检索内容？
是否有权限过滤和无法回答策略？

Agent 检查表

从单轮问答开始。
加一个工具。
加严格参数 schema。
加日志和 trace 回放。
加权限边界和停止条件。

Prompt 模板

你是 ____。
你的任务是 ____。
输入：
输出格式：
约束：
如果信息不足，请明确说明。

最小训练循环

data = [(1.0, 2.0), (2.0, 4.0), (3.0, 6.0)]
w = 0.0
lr = 0.01

for epoch in range(3):
    total_loss = 0.0
    for x, y in data:
        pred = w * x
        error = pred - y
        total_loss += error * error
        grad = 2 * error * x
        w -= lr * grad
    print(f"epoch={epoch} w={w:.3f} loss={total_loss:.3f}")

预期输出：

epoch=0 w=0.521 loss=48.630
epoch=1 w=0.907 loss=26.580
epoch=2 w=1.192 loss=14.528

按这个顺序读：数据 -> 预测 -> 损失 -> 梯度 -> 参数更新。

环境检查​

先做基线​

指标​

训练警报​

RAG 检查表​

Agent 检查表​

Prompt 模板​

最小训练循环​

环境检查

先做基线

指标

训练警报

RAG 检查表

Agent 检查表

Prompt 模板

最小训练循环