5.0 学习指南与任务单:机器学习

主要学习路线已经放在 第 5 章入口。本页只作为练习时快速查看的清单。
一句话模型
定义任务 -> 划分数据 -> 训练 baseline -> 评估 -> 查看错误 -> 改进
不知道该用哪个模型时,先做 baseline。
练习清单
| 检查项 | 证据 |
|---|---|
| 能定义任务类型 | 问题说明 |
| 能无泄漏地划分数据 | 训练/测试划分记录 |
| 能训练 dummy baseline 和一个真实模型 | baseline 对比 |
| 能为任务选择指标 | 指标说明 |
| 能查看错误样本 | 错误样本记录 |
| 能完成证据包工作坊 | ml_workshop_run/ |
证据标准
| 产物 | 应该回答什么 |
|---|---|
| 问题说明 | 任务类型是什么,什么算成功? |
| 划分说明 | 你怎样把测试数据和训练过程隔开? |
| baseline 对比 | 需要超过的最低分数是多少? |
| 指标说明 | 为什么这个指标比单纯 accuracy 更适合目标? |
| 错误记录 | 哪些错误最重要,可能是哪些特征或标签问题导致的? |
可以继续的信号
当一个表格项目包含 baseline、真实模型、指标、错误分析和别人可复现的 README 时,就可以进入第 6 章。