如何有效地用 SpaCy 生成的 PoS 标签替换句子中的单词?
如何用 SpaCy 生成的 POS 标签有效地替换句子中的单词?
数据挖掘
机器学习
nlp
斯派西
2022-02-16 21:48:52
1个回答
您不能替换句子中的标签,因为 Python 字符串是不可变的。
您可以仅使用标签创建另一个字符串:
>>> import spacy
>>> nlp = spacy.load('en_core_web_sm')
>>> doc = nlp("Apple is looking at buying U.K. startup for $1 billion")
>>> " ".join(token.tag_ for token in doc)
'NNP VBZ VBG IN VBG NNP NN IN $ CD CD'
该示例基于 spaCy文档。
如果标记被几个不同的非空格分隔符分割(在 SpaCy 中称为“多中缀标记化”),您将不得不跟踪它并且代码会更复杂。