Paper:[2112.10070] Unified Named Entity Recognition as Word-Word Relation Classification
一句话概述:基于词-词关系分类、可同时解决平铺、重叠和不连续 NER 的统一框架。
摘要:NER 任务主要有三种类型:Flat(平铺)、overlapped(重叠或嵌套)、discontinuous(不连续),越来越多的研究致力于将它们统一起来。当前的 STOA 主要包括基于 Span 和 Seq2Seq 模型,不过它们很少关注边界,可能会导致后续的偏移。本文提出的统一方法(W2NER)是将其视为词词关系分类,为此引入两种词词关系:NNW
(Next-Neighboring-Word
)和 THW-*
(Tail-Head-Word-*
)。具体而言,构造一个 2D 的词词关系网格,然后使用多粒度 2D 卷积,以更好地细化网格表示。最后,使用一个共同预测器来推理词-词关系。效果自然是最新的 STOA。
关于本文代码部分,可参考:W2NER 代码。