NLP数据集的标注笔记0.1.000

NLP数据集的标注0.1.000

命名实体识别(Named Entity Recognition,简称NER)

抽取的类别没有限制,用户可以自己定义,如时间、地点、任务名称、人物名称、型号、大小等等,结构可以是

schema = [

'时间',

'选手',

'赛事名称',

'得分'

]

关系抽取(Relation Extraction,简称RE)

首先要识别实体,然后抽取实体之间的关系,即抽取三元组(实体一,关系类型,实体二),结构可以是

schema = {

'作品名': [

'歌手',

'发行时间',

'所属专辑'

]

}

事件抽取 (Event Extraction, 简称EE)

首先确定事件,然后确定事件论元,最后确定事件的属性如:

地震事件,即地震触发词,事件论元可以是发生时间、发生地点、地震等级等,结构可以是

schema = {

'地震触发词': [

'时间',

'震级'

]

}

评价观点抽取

可以从维度,和观点词入手,如

环境不错,老板人好的评价中,环境和老板是维度,不错和好是观点

参考链接

https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/uie/doccano.md#数据转换

相关推荐
楚兴2 分钟前
MacBook M1 安装 OpenClaw 完整指南
人工智能·后端
The森3 分钟前
Linux IO 模型纵深解析 01:从 Unix 传统到 Linux 内核的 IO 第一性原理
linux·服务器·c语言·经验分享·笔记·unix
23遇见7 分钟前
探索CANN:开源AI计算底座的关键组件与技术思想
人工智能
tq10868 分钟前
Skills 的问题与解决方案
笔记
jl486382113 分钟前
变比测试仪显示屏的“标杆“配置!如何兼顾30000小时寿命与六角矢量图精准显示?
人工智能·经验分享·嵌入式硬件·物联网·人机交互
三水不滴17 分钟前
有 HTTP 了为什么还要有 RPC?
经验分享·笔记·网络协议·计算机网络·http·rpc
2301_8187305623 分钟前
transformer(上)
人工智能·深度学习·transformer
木枷29 分钟前
Online Process Reward Learning for Agentic Reinforcement Learning
人工智能·深度学习·机器学习
三块可乐两块冰36 分钟前
【第二十九周】机器学习笔记三十
笔记
m0_5637451138 分钟前
误差卡尔曼滤波在VINS-mono中的应用
人工智能·机器学习