图机器学习

盼小辉丶1 天前
机器学习·自然语言处理·图机器学习
图机器学习(16)——图数据与自然语言处理当今时代,海量信息以自然语言的形式存在。晨间浏览的新闻、发送/阅读的推文、课业报告、往来邮件,这些通过文本文档交换的信息构成了人类最主要的间接互动形式(相较于对话、手势等直接互动方式)。无疑,这是最常见的间接互动方式,与直接互动(如谈话或手势)不同。因此,如何有效利用文本信息并从中提取重要信息,已成为至关重要的技术能力。正是文本数据的爆炸性增长,直接推动了自然语言处理 (Natural Language Processing, NLP) 领域的快速发展。 本节将系统讲解自然语言文本的处理方法,并回顾一些基
盼小辉丶1 天前
人工智能·分类·图机器学习
图机器学习(18)——使用图构建文档主题分类模型我们已经学习了如何处理非结构化信息,并掌握了如何用图结构表征这类信息。我们从 Reuters-21578 基准数据集出发,通过标准 NLP 工具对文本信息进行标记和结构化处理。随后利用这些高层特征构建了多种网络类型:基于知识的网络、二分网络、节点子集的投影网络,以及反映数据集主题关联的网络。通过局部和全局属性展示了这些量化指标如何表征和描述结构各异的网络类型。在本节中,将介绍利用这些图结构构建机器学习模型,运用无监督技术识别语义社区,将主题/话题相似的文档进行聚类。
盼小辉丶2 天前
人工智能·机器学习·图机器学习
图机器学习(15)——链接预测在社交网络分析中的应用如今,社交媒体已成为最具价值且丰富多元的信息源之一。每日涌现数十万条新连接、无数用户加入社群、数十亿贴文被分享。这些自发性且非结构化的交互活动,通过图结构得以数字化呈现,从而建立秩序化关联。 在社交图分析中,机器学习能有效解决诸多重要问题。通过合理配置,可从海量数据中提取关键洞察:优化营销策略、识别危险行为用户、预测用户阅读新帖的概率等。 其中,链路预测是该领域最具价值的研究方向之一。根据社交图中连接关系的不同含义,预测未来边可应用于好友推荐、电影推荐或商品购买预测等场景,该任务旨在评估节点间未来建立连接
盼小辉丶6 天前
人工智能·机器学习·图机器学习
图机器学习(11)——链接预测链接预测 (link prediction),也称为图补全,是处理图时常见的问题。具体而言,给定一个部分观测的图(即某些节点对之间是否存在边无法确定),我们的目标是预测未知状态节点对之间是否存在边,如下图所示。
盼小辉丶8 天前
人工智能·机器学习·图机器学习
图机器学习(8)——经典监督图嵌入算法监督学习 (Supervised Learning, SL) 代表了大多数实际机器学习 (Machine Learning, ML) 任务的应用场景。得益于日益高效的数据采集,带标签数据集已经非常普遍。对于图数据同样如此,在图数据中,标签可以分配给节点、社群,甚至整个图结构。此时的任务就是学习输入数据与标签(也称为目标或标注)之间的映射函数。 例如,给定一个表示社交网络的图,我们可能需要预测哪些用户(节点)将会注销账户。通过基于历史数据训练图机器学习模型,根据用户数月后是否注销账户,将其标记为"忠实用户"
盼小辉丶9 天前
神经网络·图神经网络·图机器学习
图机器学习(10)——监督学习中的图神经网络在无监督图学习中,我们学习了图神经网络 (graph nerual network, GNN) 和图卷积网络 (graph convolutional network, GCN) 的核心原理,重点区分了谱图卷积与空间图卷积的差异。具体而言,我们深入理解了 GCN 层如何通过保持节点相似性等图属性,在无监督环境下实现图结构或节点的编码。 在本节中,将探索监督学习框架下的这些方法。此时的核心目标转变为:学习能够精准预测节点或图标签的图/节点表征。需要注意的是,编码函数保持不变,改变的是优化目标。
audyxiao0017 个月前
大数据·人工智能·深度学习·大模型·图机器学习
一文了解模式识别顶会ICPR 2024的研究热点与最新趋势对模式识别研究领域前沿方向的跟踪是提高科研能力和制定科研战略的关键。本文通过图文并茂的方式介绍了ICPR 2024的研究热点与最新趋势,帮助读者了解和跟踪模式识别的前沿研究方向。本推文的作者是黄星宇,审校为邱雪和许东舟。
orion-orion2 年前
机器学习·图机器学习·图数据挖掘
图机器学习:从图谱角度来理解图增广图对比学习(Graph Contrastive Learning, GCL)[1][2][3] 旨在以自监督的方式学习图的节点表征,其流程如下图所示:
orion-orion2 年前
图论·图机器学习·理论计算机科学
谱图论:Laplacian算子及其谱性质给定无向图\(G=(V, E)\),我们在上一篇博客《谱图论:Laplacian二次型和Markov转移算子》中介绍了其对应的Laplacian二次型:
Life Pursuer2 年前
数据挖掘·图神经网络·图机器学习·图深度学习
Code Lab - 2PyG有两个类,用于存储图以及将图转换为Tensor格式 torch_geometry.datasets 包含各种常见的图形数据集 torch_geometric.data 提供Tensor的图数据处理