你好,数据科学家
我正在尝试使用 LSTM(使用词嵌入)来生成一个可以标记句子中每个单词的系统。为此,我给它一组不同大小的句子,并使用填充使句子大小相同,以便 LSTM 可以处理它们。
问题是,在排除与填充部分相对应的标签后,LSTM 结果会给出与输入不同大小的输出。
所以我的问题是,这是一个架构问题,还是可能需要更多的训练(epocs word 更大的批次)?
谢谢您的帮助!
编辑:更多细节:
在下图中,我展示了我的 LSTM 架构
在运行一个大小为 n 的句子(使用一个热编码和词嵌入)时,我得到一个通常大小不同的结果;我所说的结果是指 lstm 的最终输出和相应的单词翻译。
此外,我目前有一些变量,我已经玩过:
BATCH_SIZE = 164
EPOCHS = 50
LSTM_NODES = 128
NUM_SENTENCES = 3000
MAX_NUM_WORDS = 250000
EMBEDDING_SIZE = 300
样本输入:
1 Cada
2 obra
3 consome
4 1,5
5 tonelada
6 de
7 aço
8 (
9 US$
10 6
11 mil
12 )
13 mais
14 US$
15 10
16 mil
17 de
18 mão-de-obra
19 .
样本输出:
1 c-am-prd*
2 c-am-prd*
3 (c-v*)
4 (am-rec*)
5 (c-v*)
6 (c-v*)
7 (c-v*)
8 (c-v*)
9 am-dis*
