neo4j图数据库基本概念和向量使用

一.节点

1.新建节点

create (n:GroupProduct {name:'都邦高保额团意险',description: "保险产品名称"} ) return n

CREATE:Neo4j 的关键字,用于创建新节点或关系。

(n:GroupProduct):

n 是节点的临时别名(变量名),方便在return中引用,创建完成之后就没用了。

GroupProduct 是节点的标签(Label),用于分类节点(如 Person, Product 等)。

{name:'都邦高保额团意险',description: "保险产品名称"}

节点的属性(Properties),键值对形式:

RETURN n:

返回新创建的节点 n,用于验证操作是否成功。

2.已有节点创建关系

MATCH (a:GroupProductA {name:'保高空'}), (b:GroupProduct {name:'都邦高保额团意险'})

CREATE (a)-[:INCLUDE {restrict: "涉电及高空作业按6类可承保"}]->(b)

变量名可以随意定义,只要能区分出来两个节点的区别,简短有意义

关系名称INCLUDE: 也可以随意定义,最好是能够见名知意,最好定义统一的团队规范

关系也可以添加属性: 比如表明这个关系有什么限制条件

使用箭头 -> 表示从左到右的关系方向

3.删除节点

MATCH (n:GroupProductA {name:'保高空' })

DETACH DELETE n

4.查询节点之间的相邻节点

MATCH (startNode {属性名: 值})-[:关系类型*..N]-(relatedNode)

RETURN startNode, relatedNode

例如:

MATCH (a {name: "保高空"})-[*..1]-(b)

RETURN a,b

关键参数说明
参数 说明 示例
* 表示遍历任意深度的关系(包括直接关联和间接关联)。 -[*] 表示所有层级关联。
*..N 最大遍历深度。例如 *..2 表示遍历 1 层或 2 层关联。 -[:EXCLUDES*..2] 最多找两跳关联。
-[]-> 单向遍历(从左到右)。 (a)-[:PARENT_OF]->(b) 只找 a 的子节点。
<-[]- 反向遍历(从右到左)。 (a)<-[:CHILD_OF]-(b) 找到 b 的父节点。

注意事项

性能问题:遍历深度(如 *..N)越大,查询耗时越长,建议根据需求限制深度。

方向性:若关系是单向的(如 EXCLUDES),需注意方向(如 ()-[:EXCLUDES]->())。

属性唯一性:确保查询的属性(如 product_id)是唯一标识符,否则可能返回多个节点。

5.对已创建好的节点添加属性

MATCH (a:GroupProductA {name:'保高空' })

SET a+= { embedding: [] }

RETURN b;

二.节点向量存储和检索

1.节点需要添加向量数组

可以选择一开添加节点的时候加一个向量属性

create (n:GroupProductA {name:'保高空',description: "保险产品可以保高空作业",embedding: [向量的具体值]}) return n

或者后续添加

MATCH (a:GroupProductA {name:'保高空' })

SET a+= { embedding: [向量具体数值] }

RETURN b;

2.给节点增加向量索引

CREATE VECTOR INDEX 索引名称 IF NOT EXISTS

FOR (具体的节点标签)

ON n.embedding

OPTIONS { indexConfig: {

`vector.dimensions`: 向量维度数值,

`vector.similarity_function`: 向量计算方法

}}

例如:

CREATE VECTOR INDEX HighDutyIdx IF NOT EXISTS

FOR (n:HighDuty)

ON n.embedding

OPTIONS { indexConfig: {

`vector.dimensions`: 1536,

`vector.similarity_function`: 'cosine'

}}

3.计算向量余弦相似度

MATCH (a:GroupProductA)

WHERE a.embedding IS NOT NULL

WITH n,

// 计算向量余弦相似度或欧氏距离

vector.similarity.cosine(n.embedding, [0.1, 0.2, ...]) AS similarity

RETURN n.name, similarity

ORDER BY similarity DESC

LIMIT 10;

4.查询两个节点的向量相似度

MATCH (a:GroupProductA {name: '保高空'})

MATCH (b:GroupProductA {name:'团意'})

RETURN vector.similarity.cosine(a.embedding, b.embedding)

5.查询所有向量索引

SHOW VECTOR INDEXES

6.删除指定向量索引

DROP INDEX moviePlots

三.RAG向量检索最佳实践

1.先查询出所有符合的向量节点,有个阈值,比如大于0.8的查询出所有符合的节点

2.然后再通过这些符合的节点,根据节点之间的关系,找到想要查询出来的节点属性

3.根据查询出来的节点属性和用户问题,给大模型总结

相关推荐
@LetsTGBot搜索引擎机器人20 分钟前
2025 Telegram 最新免费社工库机器人(LetsTG可[特殊字符])搭建指南(含 Python 脚本)
数据库·搜索引擎·机器人·开源·全文检索·facebook·twitter
计算机毕设VX:Fegn08951 小时前
计算机毕业设计|基于springboot + vue动物园管理系统(源码+数据库+文档)
数据库·vue.js·spring boot·后端·课程设计
冉冰学姐1 小时前
SSM校园排球联赛管理系统y513u(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·ssm 框架应用·开题报告、
Tony Bai2 小时前
【分布式系统】03 复制(上):“权威中心”的秩序 —— 主从架构、一致性与权衡
大数据·数据库·分布式·架构
wb043072013 小时前
SQL工坊不只是一个ORM框架
数据库·sql
至善迎风3 小时前
Redis完全指南:从诞生到实战
数据库·redis·缓存
QQ_4376643145 小时前
Redis协议与异步方式
数据库·redis·bootstrap
纪莫5 小时前
技术面:MySQL篇(InnoDB事务执行过程、事务隔离级别、事务并发异常)
数据库·java面试⑧股
Nerd Nirvana5 小时前
数据库模型全景:从原理到实践的系统性指南
数据库·oracle·电力行业
SelectDB5 小时前
从 Greenplum 到 Doris:集群缩减 2/3、年省数百万,度小满构建超大规模数据分析平台经验
数据库·数据分析·apache