10.0 学习检查表:计算机视觉
这页当成可打印检查表使用。需要完整讲解时,回到 第 10 章入口页。

两小时快速通读
| 时间 | 做什么 | 能说出这句话就停 |
|---|---|---|
| 20 分钟 | 看输出粒度阶梯图 | “分类、检测、分割的区别在输出。” |
| 25 分钟 | 运行像素小实验 | “我能检查尺寸、通道、RGB 和灰度。” |
| 25 分钟 | 浏览 10.1 图像基础 | “预处理会改变模型看到的数据。” |
| 25 分钟 | 浏览分类、检测、分割路线图 | “我知道哪个指标对应哪个任务。” |
| 25 分钟 | 阅读调试闭环 | “怀疑架构前,应先检查数据和标签。” |
必须留下的证据
| 证据 | 最小版本 |
|---|---|
opencv_demo.py 或 pixel_lab.py | 读取或生成图像、预处理、保存输出 |
vision_dataset.md | 数据来源、类别、样本数、标注方式、限制 |
eval_results.md | accuracy/F1、mAP、IoU/Dice、OCR 命中率或自选指标 |
failure_cases.md | 失败图片、可能原因、修复方向 |
README.md | 任务目标、运行命令、输入输出示例、场景边界 |
质量闸门
| 闸门 | 通过条件 |
|---|---|
| 视觉链路 | 原图、处理图、预测图和失败图用可对应的文件名保存。 |
| 标注 | 数据集说明写清类别、框或 mask、来源、划分和已知标注不确定性。 |
| 指标匹配 | accuracy/F1、mAP、IoU/Dice 或 OCR 命中率与任务输出匹配。 |
| 真实边界 | 报告写明光照、角度、相机或来源、延迟、图像尺寸和设备限制。 |
离章问题
- 你能按输出形态解释分类、检测、分割和 OCR 吗?
- 你能展示原图、处理图和预测可视化吗?
- 你能解释标注质量为什么影响指标吗?
- 你能为正确任务选择 accuracy/F1、mAP、IoU 或 Dice 吗?
- 你能说明为什么 Demo 到真实图片上会失效吗?
如果答案都是可以,就可以把视觉能力接到第 12 章的多模态方向。