在Neo4j中导入多个csv文件

对于批量导入操作,为每个文件导入使用单独的:auto命令,以确保它们不会被包含在一个显式的事务中。以下是脚本示例:

导入第一个CSV文件创建节点(Label1)
bash 复制代码
:auto USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM 'file:///xxxx.csv' AS line
CREATE (n:Label1 {id: toInteger(line.id), property1: line.property1})
导入第二个CSV文件创建节点(Label2)
bash 复制代码
:auto USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM 'file:///xxxxx2.csv' AS line
CREATE (m:Label2 {id: toInteger(line.id), property2: line.property2})

导入第三个CSV文件创建节点(Label3)

bash 复制代码
:auto USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM 'file:///xxxxxx3.csv' AS line
CREATE (m:Label3 {id: toInteger(line.id), property3: line.property3})

导入第4.5.6.7等等~~~~~个CSV文件创建节点(Labelx)

bash 复制代码
:auto USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM 'file:///xxxxxx3.csv' AS line
CREATE (m:Label4 {id: toInteger(line.id), property4: line.property4})
导入关系CSV文件创建关系
bash 复制代码
:auto USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM 'file:///guanxi.csv' AS line
MATCH (a:Label1 {id: toInteger(line.source)})
MATCH (b:Label2 {id: toInteger(line.target)})
CREATE (a)-[r:RELATIONSHIP_TYPE]->(b)
SET r = line // 如果你想将CSV中的所有列作为关系属性导入

注意事项

  • 分批提交USING PERIODIC COMMIT默认会每1000条记录提交一次事务,如果你的数据集非常大,这有助于防止内存溢出。
  • 数据验证:确保CSV文件中的数据格式正确无误,并且ID字段能够正确转换为整数类型。
  • 索引和约束:如果可能的话,在导入前创建适当的索引或唯一性约束,可以大大提高匹配节点的速度。
  • 错误处理 :考虑添加一些错误处理逻辑,例如使用MERGE代替CREATE以避免重复插入节点。

确认数据导入

首先,运行一些简单的查询以确认数据已经被正确导入到Neo4j数据库中:

bash 复制代码
MATCH (n:Label1) RETURN n LIMIT 25;

这将返回最多25个Label1类型的节点,

检查关系
bash 复制代码
MATCH ()-[r:RELATIONSHIP_TYPE]->() RETURN r LIMIT 25;

这将返回最多25条RELATIONSHIP_TYPE类型的关系,

显示所有节点和关系

如果你想要查看所有节点及其关系,可以使用以下查询:

bash 复制代码
MATCH (n)-[r]->(m)
RETURN n, r, m
LIMIT 25 // 限制返回的结果数量,避免一次性加载过多数据
相关推荐
java1234_小锋20 小时前
Spring AI快速入门
人工智能·spring·neo4j
深圳市快瞳科技有限公司2 天前
端侧喂鸟器上的轻量化鸟类识别:从模型选型到低功耗部署实战
计算机视觉·neo4j
醉挽清风7833 天前
服务器安装neo4j和jupyter
服务器·jupyter·neo4j
yeezyshappycodes6 天前
neo4j连接失败问题
neo4j
迷藏4947 天前
**发散创新:基于 Rust的模型保护机制设计与实践**在人工智能快速发
java·人工智能·python·rust·neo4j
kimi-2227 天前
Neo4j 可视化工具和产品
neo4j
kimi-2227 天前
Neo4j CQL 核心命令与操作
数据库·neo4j
heimeiyingwang9 天前
【架构实战】图数据库Neo4j在社交系统中的应用
数据库·架构·neo4j
谢白羽9 天前
图数据库语义搜索性能实测:Neo4j vs FalkorDB vs Memgraph,谁的向量检索最快?
数据库·neo4j·memgraph·falkordb
星马梦缘10 天前
cannot import name ‘deserialize‘ from ‘tensorflow.keras.models‘ 的解决方案
tensorflow·keras·neo4j