命名实体识别 (NER) 是 NLP 文献中的一个众所周知的问题。
它通常解决在文本中定位和分类命名实体的问题,例如Organizations和Products。
我正在尝试解决类似的问题,但在我看来,它更笼统一些。给定一个输入文本,我希望能够对整个文本进行全面的注释;不仅是特定的实体,例如Actorsand Organizations,还有更高层次的概念,例如Conditions of Applicabilityand Temporal Conditions,例如:
增加的困难是我们嵌套了“实体”,例如(从上面):
<denotic> must, <temporal> within the specified period </temporal>, notify ... </deontic>
这仍然可以表述为NER问题吗?如果是这样,假设数据集大约有 50 K 个示例,那么解决此任务的最佳模型类型是什么?

