上下文词嵌入
本节定位
上一节我们讲了词嵌入能把词映射到语义空间。
但它有一个很快就会遇到的大问题:
同一个词,在不同上下文里可能根本不是一个意思。
如果每个词永远只有一个固定向量,这件事就很难处理。
这正是“上下文化表示”出现的原因。
学习目标
- 理解固定词向量为什么不够
- 理解上下文化表示的核心思想
- 通过可运行示例建立“同词不同向量”的直觉
- 理解为什么这一步是从传统 NLP 走向现代预训练模型的关键转折
先建立一张地图
上下文化表示这节最适合新人的理解顺序不是“它只是更强的词向量”,而是先看清:
所以这节真正想解决的是:
- 为什么固定词向量迟早会不够
- 为什么“词义取决于上下文”会改变整个 NLP 主线
一个更适合新人的总类比
你可以把静态词向量和上下文化表示理解成:
- 静态词向量像词典里的“固定头像”
- 上下文化表示像演员在不同剧情里的“角色状态”
同一个演员是同一个人,
但在不同场景里,他的表情、动作、身份角色会不同。
同样地:
- 同一个词在不同句子里
- 也不应该永远长成同一个向量