NLP数据集的标注笔记0.1.000

NLP数据集的标注0.1.000

命名实体识别(Named Entity Recognition,简称NER)

抽取的类别没有限制,用户可以自己定义,如时间、地点、任务名称、人物名称、型号、大小等等,结构可以是

schema = [

'时间',

'选手',

'赛事名称',

'得分'

]

关系抽取(Relation Extraction,简称RE)

首先要识别实体,然后抽取实体之间的关系,即抽取三元组(实体一,关系类型,实体二),结构可以是

schema = {

'作品名': [

'歌手',

'发行时间',

'所属专辑'

]

}

事件抽取 (Event Extraction, 简称EE)

首先确定事件,然后确定事件论元,最后确定事件的属性如:

地震事件,即地震触发词,事件论元可以是发生时间、发生地点、地震等级等,结构可以是

schema = {

'地震触发词': [

'时间',

'震级'

]

}

评价观点抽取

可以从维度,和观点词入手,如

环境不错,老板人好的评价中,环境和老板是维度,不错和好是观点

参考链接

https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/uie/doccano.md#数据转换

相关推荐
甲维斯6 分钟前
Claude Code的六种种授权模式!安全和效率控制
人工智能·ai编程
curd_boy15 分钟前
【AI】生产级 Graph RAG 落地架构
人工智能·架构
夏天想19 分钟前
人类将从“执行者“变为“总导演”,学习Ai知识
人工智能·学习
yangshicong21 分钟前
第11章:结构化输出与数据提取 —— 让 AI 直接返回你想要的数据格式
数据库·人工智能·redis·python·langchain·ai编程
玄米乌龙茶12323 分钟前
LLM成长笔记(二):数据处理与工具链
笔记
@PHARAOH25 分钟前
WHAT - AI 领域的 hermes 和 harnes
人工智能
kevin 125 分钟前
财务报销智能审核怎么落地?DocFlux 智能分类抽取,全过程溯源
人工智能·ocr
言之。33 分钟前
【Python】免费的中文 AI 配音方案
开发语言·人工智能·python
zhangxingchao36 分钟前
AI应用开发七:可以替代 RAG 的技术
前端·人工智能·后端