用于情感分类的 RNN 如何处理不同的句子长度?

人工智能 神经网络 循环神经网络 文本分类 情绪分析 多标签分类
2021-11-11 10:34:17

我一直在做一门课程,教你深度神经网络,在其中一个练习中,我做了一个用于情感分类的 RNN,但我不明白 RNN 如何处理不同长度的句子在进行情感分类时。

1个回答

我们对语料库进行的基本预处理之一涉及将可变长度的句子处理为固定长度。我们可以通过多种方式做到这一点:

截短


这涉及将所有句子的长度减少到语料库中最短句子的长度。通常不这样做,因为它减少了我们可以从语料库中学习的信息量。这张图片显示了预序列截断,我们从后面删除以使句子长度相同。

截断示例

填充


在处理可变长度句子的问题时,这是最优选的方法。在这种方法中,我们将每个向量的大小增加到语料库中最长的句子。有两种方法:

  • 后填充:在结尾添加零
  • 预填充:在开头添加零

参考


Dwarampudi Mahidhar Reddy 和 NV Subba Reddy 等人的填充对 LSTM 和 CNN的影响。