NLP-UIE(Universal Information Extraction)

Focus_Liu2024-12-24 22:41

介绍：一种模型同时完成4种NLP任务。

原理：将几种NLP任务的输入和输出进行统一，联合训练。

任务：Entity提取、Relation关系、Event事件、Sentiment情感分类。

输入统一：通过prompt的方式去控制需要抽取的信息，（在信息加入任务类型，一同作为模型的输入,样本输入是[CLS]+prompt+[SEP]+text+[SEP]）

输出统一：使用SEL(Structed extraction Language)模板来统一输出。

SpotName：实体类型
AssoName：关系
InfoSpan：value。

好处：

多个任务共享表征，可以提升效果。
减少模型维护。
可以达到zero-shot的效果。
能实现多标签的提取。

如何接一个位置对应多个标签问题？

介绍：新增了一个线性层用于全局 Span 判断。例如已经得到[O,B-school,I-school,I-school,I-school,I-school,I-school]，然后可以使用不同位置组合使用进行MLP映射到新的label，例如位置4和5虽然都是I-school，但是经过MLP后可能是B-type]

实现：把位置4和位置5的向量concat后再MLP就得到span打分后的真实标签。

其他：

标记法：「BIO 标记法」、「BIOES 标记法」
传统的NLP无法解决一字多标签的问题。
源码：这是一个抽取式模型，而非论文中所述的生成式，是以ERNIE编码器，接双指针解码，这个结构不是两年前香侬AI提出的MRC模型吗，区别是在这个"UIE"中似乎只有start和end，少了交叉的部分，但是思想还是双指针的思想。

参考资料

http://www.360doc.com/content/22/1014/14/7673502_1051688308.shtml