文章目录
- [一. 无处不在的图](#一. 无处不在的图)
- [二. 如何对图数据做信息挖掘](#二. 如何对图数据做信息挖掘)
- [三. 图神经网络](#三. 图神经网络)
- [四. 图机器学习常用的编程工具](#四. 图机器学习常用的编程工具)
- [五. 图的可视化工具](#五. 图的可视化工具)
- [六. 常见的图数据库](#六. 常见的图数据库)
- [七. 图机器学习的应用举例](#七. 图机器学习的应用举例)
- [八. 结束语](#八. 结束语)
一. 无处不在的图
- 一切具有关联关系的数据都可以用图来表示。比如:交通网、知识图谱、分子结构、人际关系网、计算机网络架构、基因与蛋白质表征关系等。
二. 如何对图数据做信息挖掘
- 对于没有关联的、独立同分布的数据,传统机器学习中的CNN、RNN、Transformer算法就可以对数据很好的进行信息挖掘。
- 图机器学习与图神经网络就是专门处理图数据的方法。
- 图数据的特点:
- 图是动态变化的;
- 图的尺寸应该是任意的;
- 图的特征一般是多模态的;
- 图是没有固定的节点顺序或参考锚点的。
三. 图神经网络
- 图神经网络可以实现端到端的表示学习:
- 输入:图数据;
- 输出:新的图、新的子图、节点的类别、节点间的新连接。
- 所谓的表示学习,可以理解成图神经网络将节点信息映射成一个 d 维的向量。
- 这个 d 维的向量包含了该节点自身的信息以及它的连接信息。
- 这个过程也称为图嵌入。
四. 图机器学习常用的编程工具
五. 图的可视化工具
- AntV可视化
- Echarts可视化
- graphxr可视化
六. 常见的图数据库
- Neo4j
七. 图机器学习的应用举例
- 节点层面:根据已知的节点类别推测未知的节点类别;
- 连接层面:根据已知的连接推测未知的连接(推荐系统、药物联合副作用);
- 子图层面:聚类、社群检测、导航系统;
- 整图层面:图分类、图生成(生成一种新的分子并预测其理化性质、物理模型模拟、预测蛋白质的空间结构)。
八. 结束语
- 在工业、医疗、商业等生活中的方方面面,图的应用都正在并要一直大放异彩。
- 掌握了处理图的能力,就是掌握了窥探这个世界的不二法门。