如何使用 Doc2Vec 向量实现 LSTM 以获得表示?

数据挖掘 机器学习 lstm nlp 文本 doc2vec
2022-02-20 17:41:45

在此处输入图像描述

大家好。我是 ML 的新手。我阅读并找到了一篇关于 A Multi-Level Plagiarism Detection System Based on Deep Learning Algorithms 的论文,并想实现这个模型。但我找不到更多关于构建它的分步指南。LSTM 如何使用输入进行表示是由 Doc2vec 训练的句子的列表向量。

1个回答

LSTM 的输入是向量,向量是什么真的很重要,在信号处理中有信号窗口,在 NLP 中,这些通常是词嵌入,在这里,它们是从 Doc2vec 获得的文档表示。从方案来看,他们可能使用 Doc2vec 来获取句子嵌入。这是相当不寻常的,但绝对有可能。

如果输入向量携带足够的信息,LSTM 肯定会学习到一个合理的表示。