NLP数据集的标注笔记0.1.000

NLP数据集的标注0.1.000

命名实体识别(Named Entity Recognition,简称NER)

抽取的类别没有限制,用户可以自己定义,如时间、地点、任务名称、人物名称、型号、大小等等,结构可以是

schema = [

'时间',

'选手',

'赛事名称',

'得分'

]

关系抽取(Relation Extraction,简称RE)

首先要识别实体,然后抽取实体之间的关系,即抽取三元组(实体一,关系类型,实体二),结构可以是

schema = {

'作品名': [

'歌手',

'发行时间',

'所属专辑'

]

}

事件抽取 (Event Extraction, 简称EE)

首先确定事件,然后确定事件论元,最后确定事件的属性如:

地震事件,即地震触发词,事件论元可以是发生时间、发生地点、地震等级等,结构可以是

schema = {

'地震触发词': [

'时间',

'震级'

]

}

评价观点抽取

可以从维度,和观点词入手,如

环境不错,老板人好的评价中,环境和老板是维度,不错和好是观点

参考链接

https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/uie/doccano.md#数据转换

相关推荐
Acxymy2 分钟前
MySQL学习笔记四
笔记·学习
HUIBUR科技16 分钟前
量子计算与人工智能的结合:未来科技的双重革命
人工智能·ai·量子计算
资讯分享周20 分钟前
智谛达科技:以创新为翼,翱翔AI人形机器人蓝海
人工智能·科技·机器人
我爱吃干果36 分钟前
ZoomCharts使用方法
前端·javascript·笔记·zoom
新智元39 分钟前
斯坦福 2025 AI 指数出炉!中美 AI 终极对决差距仅剩 0.3%,DeepSeek 领衔
人工智能
新智元40 分钟前
Llama 4 爆料大反转,没在测试集上训练!华人员工实名辟谣,LeCun 出面救火
人工智能·openai
新智元41 分钟前
数学大一统的惊人胜利!天才数学家用 30 年破解不可能,边看《星战》边写论文
人工智能·openai
三品PLM系统43 分钟前
三品PLM研发管理软件如何构筑制造企业全产品生命周期管理?
大数据·运维·人工智能·安全·制造
虹科数字化与AR1 小时前
安宝特应用 | 工业AR技术赋能高端制造领域验收流程数字化转型
人工智能·ar·ar眼镜·工业ar
聪明的一休哥哥1 小时前
DeepSeek+Mermaid快速生成常用办公图表
人工智能