Skip to main content

5.0 学习指南与任务单:机器学习

机器学习学习指南项目闭环

主要学习路线已经放在 第 5 章入口。本页只作为练习时快速查看的清单。

一句话模型

定义任务 -> 划分数据 -> 训练 baseline -> 评估 -> 查看错误 -> 改进

不知道该用哪个模型时,先做 baseline。

练习清单

检查项证据
能定义任务类型问题说明
能无泄漏地划分数据训练/测试划分记录
能训练 dummy baseline 和一个真实模型baseline 对比
能为任务选择指标指标说明
能查看错误样本错误样本记录
能完成证据包工作坊ml_workshop_run/

证据标准

产物应该回答什么
问题说明任务类型是什么,什么算成功?
划分说明你怎样把测试数据和训练过程隔开?
baseline 对比需要超过的最低分数是多少?
指标说明为什么这个指标比单纯 accuracy 更适合目标?
错误记录哪些错误最重要,可能是哪些特征或标签问题导致的?

可以继续的信号

当一个表格项目包含 baseline、真实模型、指标、错误分析和别人可复现的 README 时,就可以进入第 6 章。