我正在尝试对简体中文文本进行一些 NLP(需要提取句子结构并进行命名实体识别)。我以前使用 spaCy 处理英文文本,但我看到中文模型上的注释表明它们正在进行中,而且我尝试过的示例的 NER 提取精度很差。
哪个NLP库有最成熟的预建中文语言模型?理想情况下基于 Python。
我正在尝试对简体中文文本进行一些 NLP(需要提取句子结构并进行命名实体识别)。我以前使用 spaCy 处理英文文本,但我看到中文模型上的注释表明它们正在进行中,而且我尝试过的示例的 NER 提取精度很差。
哪个NLP库有最成熟的预建中文语言模型?理想情况下基于 Python。
没有支持中文高质量命名实体识别的通用库。
其他选项包括GitHub 上的 Information-Extraction-Chinese或用代码改编论文。
在针对中文文本评估了几个库之后:
我怀疑这更多的是关于预建模型的质量,而不是库本身。