主线 4:方向拓展与毕业项目(10-12)12 AIGC 与多模态12.1-12.3 多模态、图像与视频生成1.1 学前导读:多模态基础这一章到底在学什么本页总览学前导读:多模态基础这一章到底在学什么 这一章解决的是:真实世界不是单模态的,AI 系统怎样把文本、图像、语音和视频放进同一套理解链路里。 前面的大模型主线大多围绕文本展开。到多模态阶段,课程开始把“语言模型应用”扩展到更接近真实世界的输入输出:一张图、一段音频、一段视频、一个截图、一个文档页面,都可能成为模型理解和生成的对象。 这一章在整个课程里的位置