深度学习文本分类
本节定位
传统文本分类已经能解决很多问题,
但一旦任务开始依赖:
- 语义相近表达
- 多义词
- 上下文信息
传统特征方法就容易显得吃力。
这时深度学习文本分类的价值就会开始显现:
它不只看显式词频,还能学习更连续、更抽象的文本表示。
学习目标
- 理解深度学习文本分类和传统方法的核心差别
- 理解 embedding、pooling、分类头这条最小深度分类链路
- 通过可运行示例建立“神经文本分类器”第一层直觉
- 理解为什么表示学习会改变分类效果上限
先建立一张地图
深度学习文本分类更适合按“输入怎么流动”来理解:
所以这节真正想解决的是:
- 神经文本分类器到底比传统方法多了哪一层能力
- 为什么“先学表示,再做分类”会改变效果上限
一、深度学习文本分类到底比传统方法多了什么?
1.1 它不再完全依赖手工特征
传统方法更像:
- 先手工定义文本特征
- 再训练分类器
深度方法更像:
- 一边学表示
- 一边学分类