为什么我们不对 Nlp 任务使用 2d cnn 过滤器?

数据挖掘 深度学习 美国有线电视新闻网 nlp
2022-02-27 00:50:45

CNN 在 NLP 中用于各种任务。但是我无法清楚地理解为什么我们在这些网络中只使用一维滤波器?

1个回答

文本是一维序列,但通常被视为嵌入向量的序列。所以是的,它在某种意义上是 2D 输入。但是嵌入维度实际上并没有任何空间意义;相邻维度并不比其他维度更相关。嵌入维度也没有不变性;嵌入的一部分中的相同值并不意味着相同的事情。所以假设 2D 卷积对于这种类型的输入没有意义。