初识知识图谱

什么是知识图谱

知识图谱(Knowledge Graph)是2012年由谷歌正式提出。知识图谱最基本组成单元为三元组(头实体、关系、尾实体)即(s,r,o),它将知识表示为一个图结构形式。知识图谱可以被广泛应用于搜索引擎、智能问答、推荐系统等众多领域。知识图谱为每个实体和关系学习一个向量表示(向量化表示称为Embedding或"Distributed Vector Representation")。

通过机器来理解文本中的知识有两大技术路线:第一种是抽取技术,例如:从文本中识别实体、关系和逻辑结构等;第二种是语言预训练,即通过大量的文本语料训练一个神经网络大模型,文本中的知识被隐含在参数化的向量模型中,并且向量化的表示和深度学习对机器来说是友好的。(个人认为第二种类似大模型的路线)

知识图谱的技术栈

涉及的技术:表示、存储、抽取、融合、推理、问答和分析等几个方面

知识图谱表示方法有属性图表示、RDF图模型、OWL本体表示、规则知识建模,其中前两个最为常用。

知识图谱存储是研究怎样利用已有的关系数据库存储知识图谱。图数据库具有微索引,这使得在遍历查询时更加方便,查询复杂度与数据集的整体大小无关,仅正比于相邻子图的大小。

知识图谱抽取涉及实体识别、关系抽取、事件抽取。

知识图谱融合包括实体对齐、本体映射、概念匹配。

知识图谱推理是知识图谱的核心技术和任务。目标是利用已有知识(已经存在的事实或关联关系)来推断未知的关系或事实。其方法可以分为基于符号逻辑推理和基于表示学习推理方法。传统的基于符号逻辑的方法优点是具有可解释性,缺点是不易于处理隐含和不确定的知识;基于表示学习的方法优点是推理效率高且能表征隐含知识,缺点是缺少可解释性。

相关推荐
开开心心就好3 天前
近200个工具的电脑故障修复合集
安全·智能手机·pdf·电脑·consul·memcache·1024程序员节
数据皮皮侠AI5 天前
中国城市可再生能源数据集(2005-2021)|顶刊 Sci Data 11 种能源面板
大数据·人工智能·笔记·能源·1024程序员节
计算机毕业论文辅导7 天前
物联网实战:基于MQTT协议的智能家居数据传输系统设计与实现
1024程序员节
开开心心就好8 天前
支持批量处理的视频分割工具推荐
安全·智能手机·rust·pdf·电脑·1024程序员节·lavarel
liuyao_xianhui10 天前
Linux开发工具结尾 _make
linux·运维·服务器·数据结构·哈希算法·宽度优先·1024程序员节
学传打活12 天前
【边打字.边学昆仑正义文化】_21_爱的结晶(1)
微信公众平台·1024程序员节·汉字·昆仑正义文化
数据皮皮侠AI19 天前
顶刊同款!中国地级市风灾风险与损失数据集(2000-2022)|灾害 / 环境 / 经济研究必备
大数据·人工智能·笔记·能源·1024程序员节
Fab1an20 天前
Busqueda——Hack The Box 靶机
linux·服务器·学习·1024程序员节
技术专家20 天前
Stable Diffusion系列的详细讨论 / Detailed Discussion of the Stable Diffusion Series
人工智能·python·算法·推荐算法·1024程序员节
学传打活23 天前
古代汉语是源,现代汉语是流,源与流一脉相承。
微信公众平台·1024程序员节·汉字·中华文化