Skip to main content

10.0 学习检查表:计算机视觉

这页当成可打印检查表使用。需要完整讲解时,回到 第 10 章入口页

视觉作品集证据包

两小时快速通读

时间做什么能说出这句话就停
20 分钟看输出粒度阶梯图“分类、检测、分割的区别在输出。”
25 分钟运行像素小实验“我能检查尺寸、通道、RGB 和灰度。”
25 分钟浏览 10.1 图像基础“预处理会改变模型看到的数据。”
25 分钟浏览分类、检测、分割路线图“我知道哪个指标对应哪个任务。”
25 分钟阅读调试闭环“怀疑架构前,应先检查数据和标签。”

必须留下的证据

证据最小版本
opencv_demo.pypixel_lab.py读取或生成图像、预处理、保存输出
vision_dataset.md数据来源、类别、样本数、标注方式、限制
eval_results.mdaccuracy/F1、mAP、IoU/Dice、OCR 命中率或自选指标
failure_cases.md失败图片、可能原因、修复方向
README.md任务目标、运行命令、输入输出示例、场景边界

质量闸门

闸门通过条件
视觉链路原图、处理图、预测图和失败图用可对应的文件名保存。
标注数据集说明写清类别、框或 mask、来源、划分和已知标注不确定性。
指标匹配accuracy/F1、mAP、IoU/Dice 或 OCR 命中率与任务输出匹配。
真实边界报告写明光照、角度、相机或来源、延迟、图像尺寸和设备限制。

离章问题

  • 你能按输出形态解释分类、检测、分割和 OCR 吗?
  • 你能展示原图、处理图和预测可视化吗?
  • 你能解释标注质量为什么影响指标吗?
  • 你能为正确任务选择 accuracy/F1、mAP、IoU 或 Dice 吗?
  • 你能说明为什么 Demo 到真实图片上会失效吗?

如果答案都是可以,就可以把视觉能力接到第 12 章的多模态方向。