NLP数据集的标注笔记0.1.000

NLP数据集的标注0.1.000

命名实体识别(Named Entity Recognition,简称NER)

抽取的类别没有限制,用户可以自己定义,如时间、地点、任务名称、人物名称、型号、大小等等,结构可以是

schema = [

'时间',

'选手',

'赛事名称',

'得分'

]

关系抽取(Relation Extraction,简称RE)

首先要识别实体,然后抽取实体之间的关系,即抽取三元组(实体一,关系类型,实体二),结构可以是

schema = {

'作品名': [

'歌手',

'发行时间',

'所属专辑'

]

}

事件抽取 (Event Extraction, 简称EE)

首先确定事件,然后确定事件论元,最后确定事件的属性如:

地震事件,即地震触发词,事件论元可以是发生时间、发生地点、地震等级等,结构可以是

schema = {

'地震触发词': [

'时间',

'震级'

]

}

评价观点抽取

可以从维度,和观点词入手,如

环境不错,老板人好的评价中,环境和老板是维度,不错和好是观点

参考链接

https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/uie/doccano.md#数据转换

相关推荐
卷卷说风控9 分钟前
Claude Code 技术架构深扒:Prompt / Context / Harness 三维设计实践
人工智能·架构·prompt
Frank学习路上15 分钟前
【AI技能】跟着费曼学自动驾驶
人工智能·机器学习·自动驾驶
Want59535 分钟前
Rokid AI Glasses应用开发实战:把记账助手“戴”在脸上
人工智能
bryant_meng1 小时前
【Reading Notes】(4)Favorite Articles from 2021
人工智能·深度学习·业界资讯
雷工笔记1 小时前
MES / WMS / AGV 交互时序图及生产管理模块界面设计清单
人工智能·笔记
海兰1 小时前
使用 Spring AI 打造企业级 RAG 知识库第二部分:AI 实战
java·人工智能·spring
清空mega1 小时前
动手学深度学习——多尺度锚框
人工智能·深度学习·目标跟踪
pzx_0011 小时前
【优化器】 随机梯度下降 SGD 详解
人工智能·python·算法
大邳草民1 小时前
Python 中 global 与 nonlocal 的语义与机制
开发语言·笔记·python
波动几何1 小时前
风格设计技能Style Design Generator
人工智能