图数据挖掘
一、异构图的概念(Heterogeneous Graph)
图中包含两种或以上类型的节点和/或两种或以上类型的边。
例如,在学术网络中,可能同时包含"作者"、"论文"、"会议"等不同类型的节点,以及"撰写"、"发表于"等不同类型的边。
G = (V, E, R, T )
节点是V(vertex)
边是E(edge)
关系是(relation)
节点类型是T(Vertex type)
二、有向图与无向图(directed 、undirected )
这个很容易理解,一个有方向一个没有。
主语是边,边有方向的是有向图,没有的是无向图。
因为节点是个点,没有方向的概念。
边代表两个节点之间的连接,可以定义方向。
三、图数据挖掘是干啥的?
(一)、概述
从这些复杂的连接关系中提取有价值的信息,而不仅仅是分析孤立的数据点。
也就是,
图数据挖掘 = 从"关系"中挖"知识"。
图数据挖掘也叫做图数据机器学习
(二)、图数据挖掘的主要任务:
1.节点级别预测(Node-level Prediction)
目标:为图中的每个节点预测一个标签或属性。
示例:
在社交网络中,已知某些用户是"学生"或"教师",预测其他用户的类型。
2.边级别预测(Link-level Prediction)
目标:预测两个节点之间是否存在某种关系,或预测边的类型。
示例:
在社交网络中预测两个人是否会成为好友。
3.图级别预测(Graph-level Prediction)
目标:对整个图(或子图)进行分类或回归,输出一个全局结果。
示例:
对企业组织架构图进行风险评估。
(三)、多选题

答案:ABC
解释:
D错误:
图的可视化布局(如 ForceAtlas2、t-SNE)是为了人类可读,不是原始图结构的一部分。坐标是算法生成的,不具有语义意义。同时,不同布局方式下坐标会变化,不能作为稳定特征使用。
E错误:
孤立节点是指在一个图中没有任何边与之相连的节点。
孤立节点数量是一个全局统计量,描述的是整个图的稀疏程度。
它不反映单个节点的性质,无法用于个体节点分类。