文章目录
这个概念最近比较火,没办法,必须熟悉下了。
NER是什么?
NER(named entity recognition)(命名实体识别),是nlp的核心任务之一。
主要作用就是从一段非结构化的文本中,精准地找出那些具有特定意义的"专有名词",并给它们贴上类别标签。
例如:
"马云在杭州创立了阿里巴巴。"
经过 NER 系统的处理后,输出的结果会是带有标签的结构化信息:
马云\] -\> 类别:人名 (PER) \[杭州\] -\> 类别:地名 (LOC) \[阿里巴巴\] -\> 类别:组织机构名 (ORG) 注:这里只后找出了实体,没有处理关系。 那么如果不在一个语句(一个文本)中呢? 涉及到跨句抽取(跨文本抽取),也可以实现,但是有一定技术成本。 #### RE是什么? RE(relation extraction)(关系抽取), 还是这句话:"马云在杭州创立了阿里巴巴。" 关系抽取结果三元组:(马云,创立,阿里巴巴) 这里找到了关系。 #### 三元组是什么? 三元组(主体,谓语,客体),也可以理解为主谓宾。 例如: (马云,创立,阿里巴巴) #### 和rag的区别? **数据入库时:** rag就是简单的切片存向量。 知识图谱除了存向量,还要存er关系等。 **在回答时:** rag会先从向量库查询。 知识图谱,要从图谱库和向量库查询对吧。