NLP:找到连接句子各部分的最佳介词

数据挖掘 nlp ngram
2022-02-15 12:55:09

我的任务是使用介词将句子的 2-3 个部分连接成一个整体

  • 第一部分是某种行动。前任。“拍照”
  • 第二部分是一个对象,它只能由一个名词或一个带有形容词和附加词的名词组成。前任。“多汁樱桃派”、“松鼠”
  • 第三部分是一个地方。前任。“房间”、“伦敦”

为了解决这个任务,我已经尝试了一些选项,例如使用 GPT-2(或其他网络,如 LSTM)生成和使用语法规则,但它们都没有像我想要的那样工作。

使用 GPT-2 需要大量的资源和性能,这在服务器上非常昂贵。普通的神经网络不够好,经常会产生不好的结果。并且仅使用语法规则来描述所有情况也是不可能的。

是否有任何方法可以在不使用转换器或语法规则的情况下实现该问题的解决方案,从而使模型不会太重且同时有效?

介词可能有几种选择,主要是它们被使用。

Ps 一个不错的选择是使用 n-gram,但是当第二部分很长时,不清楚如何使用它。

例子:

[倒入,榨汁,锅炉房] -> 将果汁倒入锅炉房

[去,剧院] -> 去剧院

[学习历史,芭蕾] -> 学习芭蕾舞的历史

1个回答

这类问题的传统方法是n-gram 语言模型语言模型在大型语料库上进行训练,然后计算任何不完整句子的最有可能丢失的标记相当简单。SRILM是最常见的工具包之一,但可能还有许多其他库。