我正在尝试从简历中提取大学学习和科技公司等实体,我有一份受欢迎的大学和公司的列表,我想找出哪所大学与提取的实体最匹配
例子
1) 名单中的大学:IIT Bombay
提取的实体:Education : Indian Institute of technology Bombay Btech
2)名单中的大学:Infosys
提取的实体:Infosys India Ltd.
如您所见,在提取的实体中识别出多余的不需要的词、短形式、扩展形式等,是否有最适合此目的的句子相似度算法?
使用 SpaCy 进行实体提取。