文章目录
这个概念最近比较火,没办法,必须熟悉下了。
NER是什么?
NER(named entity recognition)(命名实体识别),是nlp的核心任务之一。
主要作用就是从一段非结构化的文本中,精准地找出那些具有特定意义的"专有名词",并给它们贴上类别标签。
例如:
"马云在杭州创立了阿里巴巴。"
经过 NER 系统的处理后,输出的结果会是带有标签的结构化信息:
马云 -> 类别:人名 (PER)
杭州 -> 类别:地名 (LOC)
阿里巴巴 -> 类别:组织机构名 (ORG)
注:这里只后找出了实体,没有处理关系。
那么如果不在一个语句(一个文本)中呢?
涉及到跨句抽取(跨文本抽取),也可以实现,但是有一定技术成本。
RE是什么?
RE(relation extraction)(关系抽取),
还是这句话:"马云在杭州创立了阿里巴巴。"
关系抽取结果三元组:(马云,创立,阿里巴巴)
这里找到了关系。
三元组是什么?
三元组(主体,谓语,客体),也可以理解为主谓宾。
例如:
(马云,创立,阿里巴巴)
和rag的区别?
数据入库时:
rag就是简单的切片存向量。
知识图谱除了存向量,还要存er关系等。
在回答时:
rag会先从向量库查询。
知识图谱,要从图谱库和向量库查询对吧。