存在哪些用于事实提取的开源框架

数据挖掘 nlp
2022-03-16 21:29:33

问题可能很愚蠢,但仍然:可以使用什么工具将英文文本转换为一组“事实”

例如,句子“Julius Caesar 在 49 BC 越过 Rubicon”会被解析为:

{
"subject": "Julius Caesar (person)",
"object": "Rubicon (river)",
"verb": "to cross", 
"verb aspects": ["time": "49BC"]
}

或任何与此相近的东西

1个回答

我不知道很多例子,但我知道至少有一个这样的工具,专门用于医疗领域:SemRep

SemRep 是一个基于 UMLS 的程序,它从生物医学文本中的句子中提取称为语义预测的三部分命题。谓词由主语参数、宾语参数和绑定它们的关系组成。例如,从 (1) 中的句子中,SemRep 提取 (2) 中的谓词。

1.我们采用血液滤过治疗一名地高辛过量并发难治性高钾血症的患者。

  1. 血液滤过-治疗-患者,地高辛过量-PROCESS_OF-患者,高钾血症-并发症-地高辛过量,血液滤过-治疗(INFER)-地高辛过量

一般来说,这与语义角色标注问题密切相关:

语义角色标签(也称为浅语义解析)是为句子中的单词或短语分配标签的过程,这些标签表明它们在句子中的语义角色,例如代理、目标或结果的角色。

显然有一些可用的实现:https ://framenet.icsi.berkeley.edu/fndrupal/ASRL