阶段学习任务单：深度学习与 Transformer 基础

这个阶段的目标是让你理解神经网络如何训练、如何用 PyTorch 搭建模型，以及 Transformer 为什么成为现代大模型的基础。不要急着追求大模型训练，先把张量、模型、损失、优化器、训练循环和评估流程跑清楚。

本阶段必须完成的任务

任务	产出物	通过标准
理解神经网络训练闭环	一个手写训练流程图	能解释前向传播、损失、反向传播和参数更新
跑通 PyTorch 基础	一个最小训练脚本	能使用 Dataset、DataLoader、nn.Module 和 optimizer
完成图像或文本小任务	一个可运行训练项目	能记录训练曲线、验证指标和错误样本
理解 Attention 与 Transformer	一份结构说明笔记	能解释 Query、Key、Value、Self-Attention 和位置编码
完成阶段项目	一个深度学习实践项目	有训练日志、指标、可复现命令和复盘

本阶段对应 AI 学习助手的 v0.5 表示学习理解版。你不一定要为学习助手训练大模型，但应该理解 embedding、序列建模和 Transformer 的基础，这会直接影响后续 RAG、Prompt、微调和 Agent 的理解。

建议做一个小实验：用简单文本分类或相似度任务观察不同文本表示方法的效果。重点不是追求高分，而是理解“文本如何变成向量”“向量相似度为什么能用于检索”。

常见问题包括张量维度不匹配、训练 loss 不下降、验证集效果很差、学习率过大或过小、过拟合、GPU/CPU device 不一致、把训练指标误当成泛化能力。遇到训练问题时，先用小数据集过拟合测试，确认代码能学到东西，再扩大数据。

学完后，你应该能回答这些问题：为什么需要反向传播，optimizer 更新的是什么，Dataset 和 DataLoader 分别解决什么问题，Attention 为什么能建模上下文，Transformer 和后续大模型有什么关系。