NLP-UIE(Universal Information Extraction)

介绍:一种模型同时完成4种NLP任务。

原理:将几种NLP任务的输入和输出进行统一,联合训练。

任务:Entity提取、Relation关系、Event事件、Sentiment情感分类。

输入统一:通过prompt的方式去控制需要抽取的信息,(在信息加入任务类型,一同作为模型的输入,样本输入是CLS+prompt+SEP+text+SEP

输出统一:使用SEL(Structed extraction Language)模板来统一输出。

  • SpotName:实体类型
  • AssoName:关系
  • InfoSpan:value。

好处:

  • 多个任务共享表征,可以提升效果。
  • 减少模型维护。
  • 可以达到zero-shot的效果。
  • 能实现多标签的提取。

如何接一个位置对应多个标签问题?

介绍:新增了一个线性层用于全局 Span 判断。例如已经得到O,B-school,I-school,I-school,I-school,I-school,I-school,然后可以使用不同位置组合使用进行MLP映射到新的label,例如位置4和5虽然都是I-school,但是经过MLP后可能是B-type]

实现:把位置4和位置5的向量concat后再MLP就得到span打分后的真实标签。

其他:

  • 标记法:「BIO 标记法」、「BIOES 标记法」
  • 传统的NLP无法解决一字多标签的问题。
  • 源码:这是一个抽取式模型,而非论文中所述的生成式,是以ERNIE编码器,接双指针解码,这个结构不是两年前香侬AI提出的MRC模型吗,区别是在这个"UIE"中似乎只有start和end,少了交叉的部分,但是思想还是双指针的思想。

参考资料

http://www.360doc.com/content/22/1014/14/7673502_1051688308.shtml

相关推荐
久违 °7 小时前
【AI-Agent】TagMatrix 数据标注工具开发
人工智能·数据分析·go·agent·数据隐私
AI360labs_atyun7 小时前
腾讯推出电子牛马Marvis,好用吗?
人工智能·科技·ai
Dfreedom.7 小时前
Windows、虚拟机、开发板组网通信原理及调试通联步骤
人工智能·windows·部署·边缘计算·开发板·模型加速
3DVisionary7 小时前
蓝光三维扫描:医疗制造的精度焦虑怎么解
人工智能·算法·制造·蓝光三维扫描·医疗制造·三维检测·义齿检测
Are_You_Okkk_7 小时前
基于MonkeyCode解析AI研发新模式,根治开发低效痛点
大数据·人工智能·开源·ai编程
好评笔记8 小时前
机器学习面试八股——常用损失函数
人工智能·深度学习·算法·机器学习·校招
weixin_468466858 小时前
全局与局部注意力机制新手实战指南
人工智能·python·深度学习·算法·自然语言处理·transformer·注意力机制
weixin_468466858 小时前
工业相机成像原理新手入门指南
人工智能·自动化·机器视觉·工业相机·光学·光学系统·成像原理
回眸&啤酒鸭8 小时前
【回眸】CSDN新增功能测评——AI数字营销之内容创作
人工智能
小糖学代码8 小时前
LLM系列:环境搭建:5.Python-dotenv 环境变量管理
人工智能·python·深度学习·神经网络