预测大学名称和科技公司等名词之间的相似性?

数据挖掘 nlp 相似
2022-02-19 20:29:21

我正在尝试从简历中提取大学学习和科技公司等实体,我有一份受欢迎的大学和公司的列表,我想找出哪所大学与提取的实体最匹配

例子

1) 名单中的大学:IIT Bombay

提取的实体:Education : Indian Institute of technology Bombay Btech

2)名单中的大学:Infosys

提取的实体:Infosys India Ltd.

如您所见,在提取的实体中识别出多余的不需要的词、短形式、扩展形式等,是否有最适合此目的的句子相似度算法?

使用 SpaCy 进行实体提取。

1个回答

这是一种标准方法不可用的实体解析情况。您还必须使用缩写解析来编写自己的方法。python Dedupe 包有一些距离度量,您可以使用它们来计算相似度。