NLP数据集的标注笔记0.1.000

NLP数据集的标注0.1.000

命名实体识别(Named Entity Recognition,简称NER)

抽取的类别没有限制,用户可以自己定义,如时间、地点、任务名称、人物名称、型号、大小等等,结构可以是

schema = [

'时间',

'选手',

'赛事名称',

'得分'

]

关系抽取(Relation Extraction,简称RE)

首先要识别实体,然后抽取实体之间的关系,即抽取三元组(实体一,关系类型,实体二),结构可以是

schema = {

'作品名': [

'歌手',

'发行时间',

'所属专辑'

]

}

事件抽取 (Event Extraction, 简称EE)

首先确定事件,然后确定事件论元,最后确定事件的属性如:

地震事件,即地震触发词,事件论元可以是发生时间、发生地点、地震等级等,结构可以是

schema = {

'地震触发词': [

'时间',

'震级'

]

}

评价观点抽取

可以从维度,和观点词入手,如

环境不错,老板人好的评价中,环境和老板是维度,不错和好是观点

参考链接

https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/uie/doccano.md#数据转换

相关推荐
星辰徐哥3 小时前
Python AI基础:Matplotlib与Seaborn数据可视化
人工智能·python·matplotlib
terry6003 小时前
2026滑动拼图验证码选型指南:AI对抗下的厂商对比与落地实测
大数据·人工智能·web安全·信息与通信·数据库架构
星辰徐哥3 小时前
Python AI基础:Python面向对象编程
开发语言·人工智能·python
可涵不会debug3 小时前
当AI学会了“讲故事“:我用魔珐星云做了一个沉浸式互动叙事Agent
人工智能
沐自礼3 小时前
图像伪造识别和定位
人工智能·llm
AI 小老六3 小时前
Google AX 控制面拆解:分布式 Agent 如何把断点恢复、审计策略和执行调度收进同一条链路
人工智能·分布式·后端·ai·架构·ai编程
阿部多瑞 ABU3 小时前
数据循环悖论:AI检测模型的技术局限与生态灾难
大数据·人工智能·安全·机器学习·ai·自然语言处理
Python私教3 小时前
我准备用 AI 二开 shadcn-admin,做一个可卖的后台管理系统模板
人工智能
天青色等烟雨..3 小时前
智慧农林核心遥感技术99个案例实践
运维·人工智能·spring boot·后端·自动化
数智化精益手记局3 小时前
拆解复杂项目管理流程:用项目管理流程解决跨部门协作低效难题
大数据·运维·数据库·人工智能·产品运营