LSTM 用于具有不同句子大小但输入输出大小相同的文本

数据挖掘 nlp lstm 词嵌入
2022-03-11 13:33:15

你好,数据科学家

我正在尝试使用 LSTM(使用词嵌入)来生成一个可以标记句子中每个单词的系统。为此,我给它一组不同大小的句子,并使用填充使句子大小相同,以便 LSTM 可以处理它们。

问题是,在排除与填充部分相对应的标签后,LSTM 结果会给出与输入不同大小的输出。

所以我的问题是,这是一个架构问题,还是可能需要更多的训练(epocs word 更大的批次)?

谢谢您的帮助!

编辑:更多细节:

在下图中,我展示了我的 LSTM 架构

在此处输入图像描述

在运行一个大小为 n 的句子(使用一个热编码和词嵌入)时,我得到一个通常大小不同的结果;我所说的结果是指 lstm 的最终输出和相应的单词翻译。

此外,我目前有一些变量,我已经玩过:

BATCH_SIZE = 164
EPOCHS = 50
LSTM_NODES = 128
NUM_SENTENCES = 3000
MAX_NUM_WORDS = 250000
EMBEDDING_SIZE = 300

样本输入:

1  Cada
2  obra
3  consome
4  1,5
5  tonelada
6  de
7  aço
8  (
9  US$
10 6
11 mil
12 )
13 mais
14 US$
15 10
16 mil
17 de
18 mão-de-obra
19 .

样本输出:

1  c-am-prd*
2  c-am-prd*
3  (c-v*)
4  (am-rec*)
5  (c-v*)
6  (c-v*)
7  (c-v*)
8  (c-v*)
9  am-dis*
1个回答

问题是,在排除与填充部分相对应的标签后,LSTM 结果会给出与输入不同大小的输出。

你如何得到“LSTM 结果”?提取的“LSTM 结果”是否对原始句子中的每个单词进行了预测?

LSTM 做你想做的事不是问题。这可能是您的实施问题。如果你放一段代码,也许你会得到一些帮助。