NLP-UIE(Universal Information Extraction)

介绍:一种模型同时完成4种NLP任务。

原理:将几种NLP任务的输入和输出进行统一,联合训练。

任务:Entity提取、Relation关系、Event事件、Sentiment情感分类。

输入统一:通过prompt的方式去控制需要抽取的信息,(在信息加入任务类型,一同作为模型的输入,样本输入是[CLS]+prompt+[SEP]+text+[SEP])

输出统一:使用SEL(Structed extraction Language)模板来统一输出。

  • SpotName:实体类型
  • AssoName:关系
  • InfoSpan:value。

好处:

  • 多个任务共享表征,可以提升效果。
  • 减少模型维护。
  • 可以达到zero-shot的效果。
  • 能实现多标签的提取。

如何接一个位置对应多个标签问题?

介绍:新增了一个线性层用于全局 Span 判断。例如已经得到[O,B-school,I-school,I-school,I-school,I-school,I-school],然后可以使用不同位置组合使用进行MLP映射到新的label,例如位置4和5虽然都是I-school,但是经过MLP后可能是B-type]

实现:把位置4和位置5的向量concat后再MLP就得到span打分后的真实标签。

其他:

  • 标记法:「BIO 标记法」、「BIOES 标记法」
  • 传统的NLP无法解决一字多标签的问题。
  • 源码:这是一个抽取式模型,而非论文中所述的生成式,是以ERNIE编码器,接双指针解码,这个结构不是两年前香侬AI提出的MRC模型吗,区别是在这个"UIE"中似乎只有start和end,少了交叉的部分,但是思想还是双指针的思想。

参考资料

http://www.360doc.com/content/22/1014/14/7673502_1051688308.shtml

相关推荐
天天找自己11 分钟前
机器学习基石:深入解析线性回归
人工智能·机器学习·线性回归
Godspeed Zhao1 小时前
自动驾驶中的传感器技术12——Camera(3)
人工智能·机器学习·自动驾驶
tangjunjun-owen1 小时前
单类别目标检测中的 Varifocal Loss 与 mAP 评估:从原理到实践(特别前景和背景类区分)
人工智能·目标检测·计算机视觉
爆改模型1 小时前
【CVPR2025】计算机视觉|AnomalyNCD:让工业异常分类“脱胎换骨”!
人工智能·计算机视觉·分类
Fabarta技术团队1 小时前
Fabarta个人专属智能体限时体验中:高效、安全的长文写作新搭档
人工智能·科技·智能体
暴躁的大熊1 小时前
LLM大模型时代:生活服务领域的“生存革命“与新生态重构
人工智能
Blossom.1182 小时前
基于深度学习的医学图像分析:使用MobileNet实现医学图像分类
人工智能·深度学习·yolo·机器学习·分类·数据挖掘·迁移学习
德育处主任2 小时前
「豆包」加「PromptPilot」等于「优秀员工」
人工智能·llm·aigc
字节跳动安全中心2 小时前
猎影计划:从密流中捕获 Cobalt Strike 的隐秘身影
人工智能·安全·llm
技术炼丹人2 小时前
从RNN为什么长依赖遗忘到注意力机制的解决方案以及并行
人工智能·python·算法