如何用 SpaCy 生成的 POS 标签有效地替换句子中的单词?

数据挖掘 机器学习 nlp 斯派西
2022-02-16 21:48:52

如何有效地用 SpaCy 生成的 PoS 标签替换句子中的单词?

1个回答

您不能替换句子中的标签,因为 Python 字符串是不可变的。

您可以仅使用标签创建另一个字符串:

>>> import spacy
>>> nlp = spacy.load('en_core_web_sm')
>>> doc = nlp("Apple is looking at buying U.K. startup for $1 billion")
>>> " ".join(token.tag_ for token in doc)
'NNP VBZ VBG IN VBG NNP NN IN $ CD CD'

该示例基于 spaCy文档

如果标记被几个不同的非空格分隔符分割(在 SpaCy 中称为“多中缀标记化”),您将不得不跟踪它并且代码会更复杂。