【大模型】GraphRAG技术原理

核心概念

GraphRAG 的核心在于用大模型构建知识图谱+知识图谱聚类社区化+RAG

RAG就是输入(问题+知识)到大模型

复制代码
1-大模型自动从海量数据中构建知识图谱(提取合并实体关系)
2-聚类算法从知识图谱中聚类社区并生成社区摘要
3-输入问题,相似度算法把问题匹配图谱信息(社区摘要/节点描述),问题+图谱信息入大模型,大模型回答结果

输入IO

复制代码
输入:文本信息
输出:图数据------三元组列表(实体-关系-实体)

GraphRAG原理

构建知识图谱

图数据构建编码步骤整理

复制代码
1-输入文本,提取每个文本块的实体和关系,并对各个实体关系加描述
2-使用大模型,合并整合实体和关系以及对实体/关系的通用描述
3-输出图数据-三元组列表(实体-关系-实体)
4-生成节点embedding->图embedding,存储起来,后续local检索需要用到

节点聚类编码步骤整理

复制代码
1-分层莱顿算法对图数据聚类,划分多个社区
2-使用大模型对每个社区搞出社区报告
3-使用大模型对社区报告提炼社区摘要
3-社区摘要生成社区embedding,存储起来,后续global检索需要用到

查询知识图谱

全局搜索

总结全文、文章主题等全局问题

复制代码
1-使用大模型,输入问题+所有社区摘要
2-输出答案

局部搜索

复制代码
1-问题embedding
2-对问题embedding 进行 社区embedding+图embedding的相似度匹配,提取出和问题相似的社区摘要图谱信息
3-使用大模型,输入问题+社区摘要图谱信息
4-输出答案

GraphRAG使用实操

流程

复制代码
本地大模型部署graphrag
第一步:启动大模型的openai服务,方法很多:vIlm启动,fastchat启动,Ilama-factory启动
第二步:启动embedding模型的openai服务,方法:fastchat,目前似乎只支持bge系列,最好使用fastchat==0.2.35
第三步:安装依赖,更改配置,开始
第四步:解决报错
第五步:ok

未完待续

相关推荐
AI4Sci.2 小时前
在云服务器上基于lora微调Qwen2.5-VL-7b-Instruct模型(下)
人工智能·算法·机器学习·大模型·lora微调·大模型本地部署·qwen2.5-vl-7b
陈敬雷-充电了么-CEO兼CTO3 小时前
字节跳动开源Coze,开启AI Agent开发新时代?
人工智能·gpt·chatgpt·开源·大模型·agi·coze
Eastmount4 小时前
[AI Coding] 一.腾讯CodeBuddy IDE内测、安装及基本用法(国产AI IDE启航)
人工智能·大模型·腾讯·ai coding·codebuddy ide
山顶夕景15 小时前
【LLM】Kimi-K2模型架构(MuonClip 优化器等)
大模型·llm·agent·强化学习·智能体
哥本哈士奇(aspnetx)15 小时前
Dify快速搭建问答系统
大模型
威化饼的一隅17 小时前
【多模态】天池AFAC赛道四-智能体赋能的金融多模态报告自动化生成part2-报告输出
大模型·agent·多模态·智能体
精致先生20 小时前
RAG(检索增强生成)
人工智能·大模型·rag
威化饼的一隅1 天前
【多模态】天池AFAC赛道四-智能体赋能的金融多模态报告自动化生成part1-数据获取
大模型·agent·多模态·智能体
美林数据Tempodata1 天前
美林数据用大模型重构电能质量评估,让隐蔽合规问题无所遁形
重构·大模型
胡耀超2 天前
我们如何写好提示词、发挥LLM能力、写作指南:从认知分析到动态构建的思维方法
人工智能·python·学习·大模型·llm·提示词·八要素思维