(不确定这是否是该问题的正确社区-如果stats.或其他更合适的方法,请投反对票...)
我正在寻找有关实现非词性特定序列标记/标签的命令行工具或库(最好是 Python 或 Ruby,但此时,任何事情都可以)的建议。如果它是 PoS 特定的,但可以针对自定义类别进行重新训练,那也很好。
我发现的项目似乎大多是被遗弃的博士论文代码库或类似的,我无法让它们中的任何一个以实际的方式工作。我最了解的是pytorch-sequence-tagger。
如果它有助于提供建议:目的是区分属于图书馆类别标记的标记和属于作者姓名或书名的标记,但输入数据对于基于规则的系统来说太不规则而无法工作100%。