在实现一些NLP项目时,比如文本分割,名称实体识别,使用trigram保证比bigram更准确吗?
编辑:我正在使用 HMM 对引文记录(出版物)进行 NER。我在我的实现中使用了二元组。准确性还可以。我在 Coursera 上看到 Michael Collins 的NLP 课程,他使用 trigram HMM 进行 POS 标记。所以我想知道三元组是否会显着提高性能,或者只是一点点。而且我也很好奇,在任何情况下,trigram 是否会比 bigram 表现更差。
whuber 已经在评论中很好地概述了 trigram 的优缺点。