知识图谱+推荐系统 文献阅读

文献阅读及整理

知识图谱+推荐系统

知识图谱

1 基于知识图谱的电商领域智能问答系统研究与实现

[1]蒲海坤. 基于知识图谱的电商领域智能问答系统研究与实现[D].西京学院,2022.DOI:10.27831/d.cnki.gxjxy.2021.000079.

知识点
  1. BIO标记策略进行人工标记,构建了电商领域商品评论实体识别数据集
  2. 基于BERT-Bi GRU-MHAT-CRF模型 的命名实体识别方法并通过实验验证了其有效性。该方法首先将笔记本电脑评论数据通过BERT进行向量化后并作为Bi GRU的输入;然后,通过Bi GRU网络自动学习笔记本电脑评论数据中文本特征,并利用多头注意力机制进行特征强化;最后,使用CRF进行标签预测,识别出笔记本电脑评论数据中的实体类
  3. 实体关系抽取 方面,采用基于词典和规则的方法进行实体关系抽取。首先,根据电商商品评论数据识别出来的实体和现有评价词词典,构建针对笔记本电脑评论方面的评价对象和评价词词典;然后,结合词典构建评价对象-评价词关系的按规则抽取得实体关系对,并对每对关系标记情感值;最后,统计评价属性的评价词占比,得到实体和实体关系数据。
  4. 采用Neo4j图数据库进行知识存储。使用Neo4j 对笔记本电脑商品的评论知识进行存储,完成知识图谱的搭建,并作为问答系统的知识库
  5. 问句意图识别 模块利用基于BERT-Bi GRU-MHATCRF模型实体识别实体链接方法 对问题进行意图识别。答案反馈模块以图数据库查询语言的形式对问句意图进行表示,并在知识图谱中检索,获得碎片化的答案信息,将其整理后把答案回馈给提问用户。

2 面向个性化推荐的node2vec-side融合知识表示

[1]倪文锴,杜彦辉,马兴帮等.面向个性化推荐的node2vec-side融合知识表示[J/OL].计算机应用研究:1-8[2023-10-16].https://doi.org/10.19734/j.issn.1001-3695.2023.06.0257.

知识点
  1. 针对推荐系统中知识图谱的结构特点,在传统node2vec模型 基础上增加关系表示多元化游走策略,提出一种基于node2vec的知识表示node2vec-side,结合推荐系统知识图谱网络结构,旨在挖掘大规模推荐实体节点间潜在的关联关系,降低表示方式复杂度,提高可解释性。
  2. 经过时间复杂度分析可知,提出的知识表示方式在复杂度上低于Trans系列RGCN
  3. 在传统知识图谱数据集FB15K、WN18推荐领域数据集 MovieLens-1MBook-CrossingLast 。FM上分别进行链接预测 对比实验。实验结果表明,在MovieLens-1M数据集上,Hits @10分别提升了5.5%~12.1%,MRR提升了0.09~0.24;在BookCrossing数据集上,Hits@10分别提升了3.5%~20.6%,MRR平均提升了0.04~0.24;而在Last。FM数据集上,Hits@1提升了0.3%~8.5%,MRR平均提升了0.04~0.16,优于现有算法,验证了所提方法的有效性。

3 电商领域女装商品知识图谱的构建及应用

[1]宿恺,潘晨辉.电商领域多模态商品知识图谱构建研究[J].现代电子技术,2023,46(20):173-177.DOI:10.16652/j.issn.1004-373x.2023.20.032.

知识图谱利用图结构对商品资源进行组织整理,将用户与商品建立联系,为后续商品推荐、知识推理的发展提供思考与意见。本文以电商领域的女装类商品作为研究对象,进行商品知识图谱的构建及应用研究,主要研究方法与内容如下。

其一,本文利用文献分析法 对知识图谱的研究现状进行梳理,确定了本文研究内容将围绕数据获取与预处理、信息抽取、知识融合三个重要模块展开。

其二,构建商品知识图谱的模式层,对商品信息资源的实体与关系进行定义,采用信息转化的方式 将半结构化商品详情信息转化为三元组,进行知识图谱的存储。

其三,针对女装商品特征,设计了一套人工标注规范体系 ,采用BERT+Bi LSTM+CRF的深度学习模型 ,从非结构化的用户评论数据中进行商品特征、情感倾向的实体识别。

其四,首先融合实体类别特征、依存句法结构特征,采用规则模板的方式 进行关系抽取。然后采用Word2Vec构造实体词向量矩阵 ,利用余弦相似度计算实体相似度,完成实体融合。

最后,将经过实体融合 的实体构造成<商品,具有,商品特征>与<商品特征,正负关系,情感倾向>的三元组结构,通过商品进行链接导入商品知识图谱中,实现商品知识图谱的应用扩充。

结果表明,本文以女装商品为例,一方面,针对半结构化商品详情信息完成信息转换,构建商品知识图谱主体结构;另一方面,针对非结构化用户评论信息完成实体关系抽取、实体融合、知识图谱存储,其中实体识别的F1值达到85.61%。本文根据上述两个步骤,完成电商领域女装商品知识图谱的构建,并从信息检索与满意度评价两个角度展开商品知识图谱的应用探讨。

推荐系统

1 基于图注意力卷积神经网络的推荐系统

[1]柴文光,张振杰.基于图注意力卷积神经网络的推荐系统[J].计算机应用与软件,2023,40(08):201-206+273.

越来越多的方法聚焦于利用图神经网络挖掘知识图谱的语义信息,然而大多数方法没有根据用户具体的兴趣偏好聚合邻居节点的语义信息,也没有对知识图谱学习得到的节点嵌入表示进行建模,导致推荐性能不佳和没有充分挖掘用户与物品嵌入表示之间的语义信息。

知识点
  1. 提出基于图注意力卷积神经网络的方法。
  2. 沿着图上的路径迭代地聚合图谱中每个节点两跳以内的邻居节点信息,
  3. 并对知识图谱学习得到的用户和物品的嵌入表示进行建模,生成用户特定于该物品的特征嵌入表示。
  4. 在MovieLens-1M和Last.FM数据集上进行点击率预测实验,AUC和F1两项评价指标均超过了目前主流的RippleNet、KGCN、KGNN-LS等方法。实验结果证明了图注意力卷积神经网络和重新编码用户嵌入表示的可行性。

2 基于知识图谱的Github项目库推荐研究与实现

[1]谭国强. 基于知识图谱的Github项目库推荐研究与实现[D].山东大学,2023.DOI:10.27272/d.cnki.gshdu.2022.005224.

为了解决开源知识的信息过载问题,本文对基于知识图谱的GitHub项目库推荐进行了研究,根据用户偏好个性化推荐项目库,同时利用知识图谱中的层次性知识提高推荐效果,实现开源软件知识的主动传播。

在基于知识图谱的GitHub项目库推荐研究方面仍存在以下问题:(1)GitHub知识图谱中存在大量的引导节点,该节点与其他实体之间存在丰富的关联关系,然而现有方法没有考虑到引导节点对推荐效果产生的积极作用,导致在捕获用户偏好的过程中容易受其他实体影响,产生低质量和有偏差的用户个性化表示。(2)传统的基于知识图谱的单一结构网络学习模型没有充分利用用户-项目交互的时间依赖性和易变性,无法对隐藏在实体中的时间和结构信息进行有效融合,同时没有考虑到用户-项目二分网络作为时变系统,其时间与结构信息之间的交互机制,降低了推荐准确性。因此,为解决上述问题,针对基于知识图谱的GitHub项目库推荐,本文进行以下研究:

知识点
  1. 提出了基于引导节点图卷积神经网络 (Guided Node Graph Convolutional Neural Network,GNGCN)模型。该部分研究探索了引导节点 在知识图谱推荐任务中的积极作用,该模型通过挖掘相关节点的影响力有效地捕捉到实体之间的联系。在知识图谱中提取每个实体的邻域样本作为它们的引导节点,然后在计算某个实体的表征时结合引导节点的信息和偏向,并扩展到多跳,实现模型的卷积和聚合
    2.在基于引导节点图卷积神经网络的基础上提出了基于动态属性增强图卷积神经网络 (Dynamic Attribute Enhancement of Graph Convolutional Neural Network,DAEGCN)模型。本文在该部分提出的混合推荐模型DAEGCN将时间模式的识别 描述为一个项目流行度增长的预测问题,利用时间序列分析来解决,并将其与基于知识图谱的图卷积神经网络结合,充分对结构信息和时间信息进行了挖掘与融合。
    3.本文根据构建的推荐模型设计并实现了基于知识图谱的GitHub推荐平台。平台可以自动爬取GitHub实体知识,为模型实验提供数据集。平台根据用户交互行为建模计算结果进行推荐,返回推荐结果。平台为用户提供了知识检索功能,根据用户输入返回知识。本文根据GitHub-SKG数据集和GitHub-SKGT数据集分别对GNGCN模型和DAEGCN模型进行实验评估。本文提出的模型相比于基线模型在推荐性能和模型规模上均有不同程度的提升和改进。

3 基于知识图谱的推荐系统研究综述

[1]秦川,祝恒书,庄福振等.基于知识图谱的推荐系统研究综述[J].中国科学:信息科学,2020,50(07):937-956.

推荐系统旨在为用户推荐个性化的在线商品或信息,其广泛应用于众多Web场景之中,来处理海量信息数据所导致的信息过载问题,以此提升用户体验.鉴于推荐系统强大的实用性,自20世纪90年代中期以来,研究者针对其方法与应用两方面,进行了大量广泛的研究.近年来,很多工作发现知识图谱中所蕴含的丰富信息可以有效地解决推荐系统中存在的一系列关键问题,例如数据稀疏、冷启动、推荐多样性等.因此,本文针对基于知识图谱的推荐系统这一领域进行了全面的综述.具体地,首先简单介绍推荐系统与知识图谱中的一些基本概念.随后,详细介绍现有方法如何挖掘知识图谱不同种类的信息并应用于推荐系统.此外,总结了相关的一系列推荐应用场景.最后,提出了对基于知识图谱的推荐系统前景的看法,并展望了该领域未来的研究方向.

知识点

4 基于知识图谱的图神经网络推荐算法研究

[1]秦琪琦. 知识图谱嵌入的图神经网络推荐方法研究[D].太原理工大学,2022.DOI:10.27352/d.cnki.gylgu.2022.001765.

5 基于知识图谱的图神经网络推荐算法研究

[1]张瀚文. 基于知识图谱的图神经网络推荐算法研究[D].广西师范大学,2023.DOI:10.27036/d.cnki.ggxsu.2023.001846.

第 1 章 绪论...1

1.1 研究背景与意义...1

1.2 国内外研究现状...3

1.2.1 传统的推荐算法研究现状...3

1.2.2 基于知识图谱的推荐算法研究现状...4

1.2.3 基于知识图谱的图神经网络推荐算法研究现状 ...5

1.3 主要研究内容...7

1.4 论文组织结构...8

第 2 章 相关理论基础 ...9

2.1 知识图谱...9

2.2 图神经网络...11

2.3 基于知识图谱的图神经网络推荐算法 ...14

2.4 本章小结...16

第 3 章 基于知识图谱的双通道图神经网络降噪推荐算法...17

3.1 问题分析...17

3.2 算法整体框架...18

3.3 双通道图神经网络...19

3.3.1 实体通道...19

3.3.2 关系通道...20

3.3.3 双通道平衡机制...20

3.4 个性化知识感知注意力网络 ...21

3.4.1 知识实体集...21

3.4.2 个性化知识感知注意力...22

3.5 学习算法...23

3.6 实验与分析...25

3.6.1 数据集...25

3.6.2 基线算法...26

3.6.3 实验设置...26

3.6.4 实验结果分析...27

3.6.5 消融实验分析...29

3.7 本章小结...33

第 4 章 基于潜在知识增强的图神经网络推荐算法 ...35

4.1 问题分析...35

4.2 算法整体框架...35

4.3 潜在项目集构建模块...36

4.3.1 用户潜在兴趣项目集构建...37

4.3.2 项目潜在语义项目集构建...37

4.4 知识图谱传播模块...38

4.5 学习算法...40

4.6 实验与分析...42

4.6.1 数据集...42

4.6.2 基线算法...43

4.6.3 实验设置...43

4.6.4 实验结果分析...43

4.6.5 消融实验分析...44

4.7 本章小结...46

第 5 章 总结与展望 ...47

5.1 总结...47

5.2 展望...48

参考文献...49

基于知识图

谱的双通道图神经网络降噪推荐算法和基于潜在知识增强的图神经网络推荐算法,主

要研究内容如下:

(1) 针对推荐过程中的噪声问题,本文提出了基于知识图谱的双通道图神经网络

降噪推荐算法(KDGNN),该算法旨在减少推荐过程中的噪声来提高推荐性能。具体

来说,首先该算法设计了一个双通道图神经网络,能够同时提取邻居实体特征和关系

特征,从而最大程度的提取知识图谱中的知识信息。其次,该算法设计了一种个性化

的门控机制,即双通道平衡机制,以阻止知识图谱中冗余噪声的传播。然后,集成用

户个性化信号和知识感知信号,以充分全面地捕捉用户偏好,并使用个性化的知识感

知注意力对用户的交互数据进行去噪。最后,在三个公共数据集上进行实验性能分析,

验证了 KDGNN 算法的有效性。实验结果表明,KDGNN 算法优于对比的先进基线算

法,尤其是在 Last.FM 数据集上,在 AUC 上提升了 2.6%,F1 上提升了 1.9%。

(2) 针对用户交互数据稀疏且现有方法难以挖掘项目的非局部知识信息的问题,

本文提出了一种基于潜在知识增强的图神经网络推荐算法(PKGNN)。具体来说,首

先充分利用用户-项目交互数据,扩展用户的潜在兴趣项目。然后利用知识图谱中丰

富的语义信息,扩展与项目有着语义相关的潜在项目。再将用户和项目的潜在相关项

目进行知识传播,从而提取用户和项目的非局部邻居信息。最后,在不同的数据集上

进行实验性能分析。实验结果表明,PKGNN 相比基线算法有着更好的推荐性能,相

比于最强基线算法,整体性能提升 5%左右。

6 知识图谱推荐系统研究综述

[1]赵晔辉,柳林,王海龙等.知识图谱推荐系统研究综述[J].计算机科学与探索,2023,17(04):771-791.

相关推荐
_.Switch10 分钟前
Python机器学习模型的部署与维护:版本管理、监控与更新策略
开发语言·人工智能·python·算法·机器学习
XiaoLiuLB29 分钟前
ChatGPT Canvas:交互式对话编辑器
人工智能·自然语言处理·chatgpt·编辑器·aigc
Hoper.J29 分钟前
PyTorch 模型保存与加载的三种常用方式
人工智能·pytorch·python
菜就多练_082832 分钟前
《深度学习》OpenCV 摄像头OCR 过程及案例解析
人工智能·深度学习·opencv·ocr
达柳斯·绍达华·宁1 小时前
CNN中的平移不变性和平移等变性
人工智能·神经网络·cnn
技术无疆2 小时前
【Python】Streamlit:为数据科学与机器学习打造的简易应用框架
开发语言·人工智能·python·深度学习·神经网络·机器学习·数据挖掘
xuehaishijue2 小时前
红外画面空中目标检测系统源码分享
人工智能·目标检测·计算机视觉
羊小猪~~2 小时前
机器学习/数据分析--用通俗语言讲解时间序列自回归(AR)模型,并用其预测天气,拟合度98%+
人工智能·python·机器学习·数据挖掘·数据分析·回归·时序数据库
浊酒南街2 小时前
吴恩达深度学习笔记:卷积神经网络(Foundations of Convolutional Neural Networks)2.7-2.8
人工智能·深度学习·神经网络