NLP数据集的标注笔记0.1.000

NLP数据集的标注0.1.000

命名实体识别(Named Entity Recognition,简称NER)

抽取的类别没有限制,用户可以自己定义,如时间、地点、任务名称、人物名称、型号、大小等等,结构可以是

schema = [

'时间',

'选手',

'赛事名称',

'得分'

]

关系抽取(Relation Extraction,简称RE)

首先要识别实体,然后抽取实体之间的关系,即抽取三元组(实体一,关系类型,实体二),结构可以是

schema = {

'作品名': [

'歌手',

'发行时间',

'所属专辑'

]

}

事件抽取 (Event Extraction, 简称EE)

首先确定事件,然后确定事件论元,最后确定事件的属性如:

地震事件,即地震触发词,事件论元可以是发生时间、发生地点、地震等级等,结构可以是

schema = {

'地震触发词': [

'时间',

'震级'

]

}

评价观点抽取

可以从维度,和观点词入手,如

环境不错,老板人好的评价中,环境和老板是维度,不错和好是观点

参考链接

https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/uie/doccano.md#数据转换

相关推荐
大刘讲IT20 小时前
下一代固态硬盘引入HBM缓存技术的深度可行性分析
人工智能·经验分享·缓存·ai
WeiJingYu.20 小时前
P3.7计算机视觉
人工智能·opencv·计算机视觉
哈基鑫20 小时前
深度学习之图像分类笔记
笔记·深度学习·分类
润 下20 小时前
C语言——深入理解函数声明定义和调用访问
c语言·开发语言·经验分享·笔记·程序人生·其他
胡耀超20 小时前
4、存储系统架构 - 从机械到闪存的速度革命
服务器·人工智能·架构·gpu·储存·闪存
新加坡内哥谈技术20 小时前
Airbnb内部核心键值存储系统 Mussel 已完成从 v1 到 v2 的重构升级
人工智能
zzywxc78721 小时前
AI 开发工具全景指南:从编码辅助到模型部署的全流程实践
大数据·人工智能·低代码·机器学习·golang·自动化·ai编程
liliangcsdn21 小时前
mac基于mlx运行轻量级模型gemma-3-270m
人工智能·macos
铮铭21 小时前
【论文阅读】具身人工智能:从大型语言模型到世界模型
论文阅读·人工智能·语言模型
en-route21 小时前
从零开始学神经网络——CNN(卷积神经网络)
人工智能·神经网络·cnn