跳到主要内容

课程视觉增强规划

现在课程已经有阶段首页主视觉,也有大量 Mermaid 流程图。下一步不是给每页都塞图片,而是把图片放在最能降低理解成本的位置。

一个简单原则是:

内容类型更适合的视觉形式说明
抽象概念类比插图、结构示意图帮新人先建立画面感
多步骤流程Mermaid 或流程图帮新人知道先后顺序
数学与数据代码生成图表比 AI 生成图更准确
模型结构模块结构图帮新人理解输入、输出和中间层
项目实战架构图、界面草图、结果样例图帮新人知道最终要做成什么
历史背景时间线图、人物与论文卡片帮新人把算法放回时代里

优先级规则

优先级适合先做的图原因
P0每个阶段首页主视觉已完成,负责建立阶段氛围
P1每章第一篇主干课的概念图最影响新人第一印象
P1项目页的系统架构图和结果样例图最能帮助上手
P2数学、训练、评估类代码可视化能把抽象过程变成可观察结果
P2历史时间线和论文故事图提升兴趣和记忆点
P3装饰型插图只有在页面很干、读感疲劳时再加

第 0 阶段:开发者工具基础

章节建议加图优先级
终端命令行终端、目录树、命令执行结果之间的关系图P1
Git 基础工作区、暂存区、本地仓库、远程仓库四格图P1
开发环境Python 环境、VS Code、Jupyter、依赖文件的关系图P2

适合生成的图片:开发工作台、Git 存档系统、环境隔离实验室。

更适合代码或 Mermaid 的图:Git 状态流、分支合并过程、虚拟环境路径关系。

第 1 阶段:Python 编程基础

章节建议加图优先级
Python 基础语法变量、分支、循环、函数如何组成程序的积木图P1
Python 进阶对象、异常、文件、生成器的运行时关系图P2
项目实战CLI、Web API、AI API 的输入输出界面草图P1

适合生成的图片:Python 小工具工坊、API 请求和响应工作台。

更适合代码生成的图:函数调用栈、JSON 文件读写前后对比。

第 2 阶段:数据分析与可视化

章节建议加图优先级
纯 Python 数据热身原始列表/字典如何变成表格的示意图P2
NumPy数组 shape、切片、广播和矩阵乘法示意图P1
PandasDataFrame、Index、列选择、groupby、merge 的表格动画感示意图P1
数据可视化图表选择决策树和“同一数据不同图表”的对比图P1
数据库选修表、主键、外键、SQL 查询路径图P2
项目实战EDA 报告样例图、多数据源合并流程图P1

适合生成的图片:数据侦探工作台、分析报告封面、数据库档案系统。

更适合代码生成的图:直方图、箱线图、散点图、折线图、热力图。

第 3 阶段:AI 数学基础

章节建议加图优先级
线性代数向量箭头、矩阵变换、特征向量方向、SVD 拆解图P1
概率与统计概率树、分布曲线、采样误差、MLE/EM 侦探类比图P1
微积分与优化函数曲线、切线、梯度箭头、下山路径、链式法则传递图P1

适合生成的图片:数学眼镜、梯度下山地图、概率侦探。

更适合代码生成的图:二维向量、正态分布、交叉熵曲线、梯度下降轨迹。

第 4 阶段:机器学习

章节建议加图优先级
机器学习基础任务定义、数据划分、baseline、评估、复盘闭环图P1
监督学习线性回归拟合线、逻辑回归决策边界、树模型分裂图P1
无监督学习聚类结果、PCA 投影、异常点检测示意图P1
模型评估混淆矩阵、偏差方差曲线、交叉验证折叠图P1
特征工程原始字段到特征表的加工流水线图P2
项目实战房价、流失、分群项目的报告版式和错误分析看板P1

适合生成的图片:建模侦探报告、模型训练流水线。

更适合代码生成的图:决策边界、残差图、ROC/PR 曲线、PCA 可视化。

第 5 阶段:深度学习与 Transformer

章节建议加图优先级
神经网络基础神经元、MLP、激活函数、反向传播责任传递图P1
PyTorchTensor、Dataset、DataLoader、Module、Training Loop 关系图P1
CNN卷积核滑动、特征图、池化、经典架构演进图P1
RNN时间展开、隐藏状态传递、LSTM 门控图P1
TransformerQKV、Self-Attention、Encoder/Decoder block 结构图P1
生成模型GAN 对抗关系、VAE 潜空间、生成样本演化图P2
训练技巧训练曲线诊断图、压缩决策树、调参记录看板P2
项目实战图像分类、情感分析、生成项目的结果展示模板P1

适合生成的图片:模型发动机舱、神经网络训练实验室。

更适合代码生成的图:loss 曲线、激活函数曲线、注意力热力图、潜空间散点图。

第 6 阶段:计算机视觉

章节建议加图优先级
CV 基础像素网格、RGB 通道、滤波、边缘检测前后对比P1
图像分类数据增强前后对比、架构演进、错误样本墙P1
目标检测bounding box、IoU、NMS、YOLO 网格示意图P1
图像分割语义分割 mask、实例分割 mask、边界错误示意图P1
高级视觉人脸识别流水线、OCR 版面解析、视频帧分析、3D 点云P1
视觉项目安防告警闭环、医学影像复核看板P1

适合生成的图片:视觉任务地图、图像理解工作台。

更适合真实/代码图:预处理前后图、检测框、分割 mask、OCR 框选结果。

第 7 阶段:自然语言处理

章节建议加图优先级
文本基础文本清洗、分词、BoW/TF-IDF 表示对比图P1
表示学习one-hot 到 Word2Vec 再到上下文化表示的演进图P1
文本分类传统分类和深度分类输入路径对比图P2
序列标注BIO 标签到实体恢复的彩色标注图P1
Seq2SeqEncoder-Decoder、Attention 对齐矩阵、翻译流程图P1
预训练模型BERT/GPT/T5 任务组织差异图P1
NLP 项目问答、摘要、信息抽取的输入输出样例图P1

适合生成的图片:文本理解助手、语言模型演进路线。

更适合代码生成的图:TF-IDF 表格、词向量近邻、注意力对齐热力图。

第 8A 阶段:大模型原理、Prompt 与微调

章节建议加图优先级
NLP 速成Tokenizer、Embedding、HuggingFace pipeline 运行图P2
LLM 概览GPT/BERT/Transformer 发展时间线图P1
Transformer 深入Attention 复杂度、模型变体、规模化计算结构图P1
预训练数据清洗、训练目标、训练集群流水线图P1
Prompt坏 Prompt 到好 Prompt 的对比卡片P1
微调Full fine-tune、LoRA、QLoRA 参数更新对比图P1
对齐SFT、Reward Model、RLHF 流程图P1
项目领域微调方案文档和评估看板P2

适合生成的图片:大模型能力工厂、Prompt 实验台。

更适合 Mermaid/代码图:结构化输出 schema、LoRA 插件结构、RLHF 流程。

第 8B 阶段:LLM 应用开发与 RAG

章节建议加图优先级
RAG文档解析、切块、向量库、检索、重排、引用闭环图P1
部署本地模型、推理服务、统一 API 的系统拓扑图P1
应用开发Function Calling、对话状态、文档解析、模板导出的工作流图P1
工程化异步并发、API、日志监控、Docker 部署架构图P2
综合项目企业知识库、智能助手、课件生成助手的产品界面草图P1

适合生成的图片:知识库引擎室、课件生成助手工作台。

更适合 Mermaid/结构图:RAG trace、工具调用链、API 请求响应、日志字段流。

第 9 阶段:AI Agent

章节建议加图优先级
Agent 基础Agent 与聊天机器人、工作流、函数调用的边界对比图P1
推理与规划ReAct、Plan-and-Execute、反思循环图P1
工具工具 schema、工具选择、工具安全边界图P1
记忆短期记忆、长期记忆、情景记忆、程序记忆分层图P1
MCPHost、Client、Server、Resource、Tool 的协议结构图P1
框架LangGraph、LlamaIndex、AutoGen 等选型矩阵图P2
多 Agent角色协作、消息传递、任务分配图P1
评估安全trace 回放、护栏分层、权限确认图P1
部署运维Agent 运行时、队列、日志、恢复、成本监控架构图P1
项目研究助手、数据分析 Agent、多 Agent 团队的执行轨迹图P1

适合生成的图片:Agent 指挥台、多工具协作控制室。

更适合 Mermaid/结构图:执行 trace、状态机、工具白名单、人工确认流程。

第 10 阶段:AIGC 与多模态

章节建议加图优先级
多模态基础文本、图像、语音、视频对齐与融合图P1
图像生成扩散模型加噪去噪、Stable Diffusion 组件图、LoRA 微调前后对比P1
视频与语音文案、分镜、TTS、视频生成、数字人流水线图P1
前沿与合规风险分级、版权审核、人工复核流程图P2
综合项目AI 创意平台界面草图、资产版本流、导出包结构图P1

适合生成的图片:AI 创意工作台、多模态内容工厂。

更适合真实/流程图:生成工作流、资产版本树、审核清单、输出 bundle。

最值得先生成的 20 张图

如果只先做一批,我建议按下面顺序生成或制作:

顺序图片建议插入位置类型
1Git 工作区、暂存区、本地库、远程库四格图stage0/ch02-git/01-git-basics.md流程示意
2Pandas DataFrame 结构图stage2/ch03-pandas/01-core-structures.md概念图
3图表选择决策树stage2/ch04-visualization/04-best-practices.md决策图
4梯度下降下山路径图stage3/ch03-calculus/03-gradient-descent.md代码可视化
5机器学习建模闭环图stage4/ch01-ml-basics/01-what-is-ml.md流程图
6混淆矩阵和错误代价图stage4/ch04-evaluation/01-metrics.md教学图
7PyTorch 训练循环图stage5/ch02-pytorch/05-training-loop.md流程图
8CNN 卷积核滑动示意图stage5/ch03-cnn/01-convolution-basics.md概念图
9Self-Attention QKV 图stage5/ch05-transformer/01-attention-mechanism.md结构图
10目标检测输出拆解图stage6/ch03-detection/01-detection-overview.md任务图
11语义分割 mask 对比图stage6/ch04-segmentation/01-semantic-segmentation.md结果图
12BIO 标签到实体恢复图stage7/ch04-sequence-labeling/01-ner-overview.md标注图
13BERT/GPT/T5 对比图stage7/ch06-pretrained/00-roadmap.md对比图
14Prompt 改写前后对比卡stage8a/ch05-prompt/01-prompt-basics.md对比图
15LoRA 参数更新对比图stage8a/ch06-finetuning/02-lora-qlora.md结构图
16RAG 文档到答案闭环图stage8b/ch01-rag/01-rag-basics.md系统图
17课件生成助手工作流图stage8b/ch05-projects/04-courseware-assistant.md项目架构图
18Agent 工具调用 trace 图stage9/ch03-tools/08-multi-tool-practice.md执行轨迹图
19Agent 护栏分层图stage9/ch08-eval-safety/04-guardrails.md安全图
20扩散模型加噪去噪图stage10/ch02-image-gen/01-diffusion-models.md模型过程图

第二批建议生成的 25 张图

第一批已经覆盖阶段入口和最核心概念。第二批继续补“新人容易卡住、但又是后续课程地基”的页面,优先补概念结构图、算法直觉图和项目流程图。

顺序图片建议插入位置类型
1Matplotlib Figure 与 Axes 结构图stage2/ch04-visualization/01-matplotlib.md对象模型图
2Seaborn 统计图选择图stage2/ch04-visualization/02-seaborn.md图谱图
3SQL 表连接关系图stage2/ch05-database/02-sql-basics.md数据关系图
4EDA 探索性数据分析流程图stage2/ch06-projects/01-eda-project.md项目流程图
5向量点积与余弦相似度几何图stage3/ch01-linear-algebra/01-vectors.md几何直觉图
6矩阵线性变换网格图stage3/ch01-linear-algebra/02-matrices.md数学可视化
7概率分布与贝叶斯更新图stage3/ch02-probability/01-probability-basics.md概念图
8信息熵与不确定性图stage3/ch02-probability/04-information-theory.md概念图
9Scikit-learn Estimator 与 Pipeline 图stage4/ch01-ml-basics/02-sklearn-intro.md工程流程图
10线性回归拟合与损失曲面图stage4/ch02-supervised/01-linear-regression.md算法直觉图
11逻辑回归决策边界图stage4/ch02-supervised/02-logistic-regression.md分类边界图
12决策树分裂路径图stage4/ch02-supervised/03-decision-trees.md算法结构图
13集成学习投票与森林图stage4/ch02-supervised/04-ensemble-learning.md模型集成图
14K-Means 聚类中心迭代图stage4/ch03-unsupervised/01-clustering.md算法过程图
15PCA 降维投影图stage4/ch03-unsupervised/02-dimensionality-reduction.md空间投影图
16神经网络前向与反向传播图stage5/ch01-nn-basics/02-forward-backward.md训练机制图
17经典 CNN 架构演进图stage5/ch03-cnn/03-classic-architectures.md历史演进图
18LSTM 门控记忆流图stage5/ch04-rnn/02-lstm-gru.md结构机制图
19Transformer Block 架构图stage5/ch05-transformer/02-transformer-architecture.md模块结构图
20词向量语义邻域图stage7/ch02-embeddings/01-word-embedding.md语义空间图
21BERT Masked Language Model 图stage7/ch06-pretrained/02-bert.md预训练目标图
22GPT 自回归生成图stage7/ch06-pretrained/03-gpt-series.md生成机制图
23RLHF 三阶段流程图stage8a/ch07-alignment/02-rlhf.md对齐流程图
24RAG 评估三角图stage8b/ch01-rag/07-rag-evaluation.md评估框架图
25Agent 记忆系统分层图stage9/ch04-memory/01-memory-overview.md系统结构图

生成策略

第一批先做 P1 教学图,不做装饰图。课程图要服务理解,不要只是让页面看起来热闹。

第二批补项目页截图和界面草图。项目页最需要让新人知道“最终作品长什么样”,尤其是 RAG、Agent、课件生成助手和多模态创意平台。

第三批再补历史人物、论文和算法故事图。这类图适合放在历史页和章节开头,帮助记忆技术为什么出现。

使用当前图片脚本的建议

当前脚本 scripts/generate_course_images.py 已经能管理课程图片资产。后续可以继续把上面的高优先级图片追加到 IMAGE_JOBS,并用下面方式生成:

pip install -r requirements-course-ai.txt
export OPENAI_API_KEY="your_api_key_here"
export OPENAI_BASE_URL="https://cliproxy.airoads.org/v1"
export OPENAI_IMAGE_MODEL="gpt-image-2"
npm run images:dry-run
npm run images:generate

对于数学曲线、训练曲线、检测框和分割 mask,优先用代码生成,因为它们需要准确。对于阶段主视觉、项目工作台和历史故事图,可以用图像生成模型制作。