主线 4:方向拓展与毕业项目(10-12)12 AIGC 与多模态12.1-12.3 多模态、图像与视频生成3.1 学前导读:视频与语音生成这一章到底在学什么本页总览学前导读:视频与语音生成这一章到底在学什么 这一章解决的是:当内容从静态图像变成带时间展开的媒体时,生成为什么会一下子复杂很多。 图像生成只需要处理单张画面,视频和语音生成却要处理连续变化。视频要保持主体、场景、动作和镜头的一致性;语音要保持音色、语速、情绪和文本对齐;数字人还要把图像、语音、口型、动作和身份一致性组合起来。 这一章在整个课程里的位置