Neo4j批量导入数据

导入大量数据时使用CSV 文件比较方便。下面分导入节点导入关系两部分说明。

1 节点信息导入

首先导入岗位信息,这里我们用id来标识,其中id对于每一个岗位来说是唯一的。

id信息我们已经事先处理好保存在了csv文件中,格式如下,其中第一行是列名。

csv 复制代码
id
0
1
2
3
4
5

我们首先要把这个csv 文件复制到 Neo4jimport 文件夹下。(具体:在我的机器中为'D:\App\neo4j\Data\relate-data\dbmss\dbms-278f05b5-0b41-40cf-883f-a5617288cb48\import',里面的dbms-278f05b5-0b41-40cf-883f-a5617288cb48对应着希望导入节点的项目。

导入的Cypher语句为:

Cypher 复制代码
LOAD CSV WITH HEADERS FROM 'file:///node_id.csv' AS line FIELDTERMINATOR ','
CREATE (:Job { name: line.id})

看一下添加后的结果。 按照同样的方法添加公司、平均工资、岗位名和教育背景

Cypher 复制代码
LOAD CSV WITH HEADERS FROM 'file:///node_salary.csv' AS line FIELDTERMINATOR ','
CREATE (:Salary { name: line.salary})

LOAD CSV WITH HEADERS FROM 'file:///node_title.csv' AS line FIELDTERMINATOR ','
CREATE (:Title { name: line.title})

LOAD CSV WITH HEADERS FROM 'file:///node_company.csv' AS line FIELDTERMINATOR ','
CREATE (:Company { name: line.company})

LOAD CSV WITH HEADERS FROM 'file:///node_education.csv' AS line FIELDTERMINATOR ','
CREATE (:Education { name: line.education})

characters、duties和skills 数据是使用 entity extraction 技术对岗位描述进行提取得到的,我们首先把每一个处理后的数据保存到 json 文件中。

json 复制代码
{
    "skill": [
        "前端",
        "CSS3",
        "Sass",
        "Less",
        "Vue",
        "JavaScript",
        "HTML5;"
    ],
    "character": [
        "None;"
    ],
    "duty": [
        "前端模块化,组件化开发",
        "Vue",
        "element",
        "UI",
        "Sass",
        "Less",
        "CSS3",
        "HTML5",
        "uni-app",
        "flex/grid布局",
        "项目经验者优先;"
    ]
}

然后遍历文件夹下所有 json 文件,保持数据唯一之后存至 csv 文件中。

Cypher 复制代码
LOAD CSV WITH HEADERS FROM 'file:///unique_characters.csv' AS line FIELDTERMINATOR ','
CREATE (:Characters { name: line.Data})

LOAD CSV WITH HEADERS FROM 'file:///unique_duties.csv' AS line FIELDTERMINATOR ','
CREATE (:Duties { name: line.Data})

LOAD CSV WITH HEADERS FROM 'file:///unique_skills.csv' AS line FIELDTERMINATOR ','
CREATE (:Skills { name: line.Data})

同样查看一下 技能 的节点添加情况:

注意:由于这些节点信息在保存到csv 文件的过程中我就已经去重了,如果没有提前去重,可以把上面的 Cypher 语句中的所有 CREATE 替换为 MERGE 从而实现添加&&去重。

2 关系信息导入

现在有格式如下的csv 文件:

csv 复制代码
id,company,title,education,salary
0,广东倾云科技有限公司,【初级】web前端开发工程师,大专,39.0
1,火眼科技(天津)有限公司,IT运维工程师,大专,36.0
2,郑州玉带信息技术有限责任公司,实习web前端开发工程师,大专,42.0

同样首先把文件复制到项目对应文件夹下的import 文件夹中,然后使用Cypher 语句实现数据导入BELONG关 系:

Cypher 复制代码
LOAD CSV WITH HEADERS FROM 'file:///relation1.csv' AS row
MATCH (a:Job {name: row.id})
MATCH (b:Company {name: row.company})
MERGE (a)-[:BELONG]->(b);

看一下岗位和公司之间的关系 添加 ideducationsalary 之间的关系

Cypher 复制代码
LOAD CSV WITH HEADERS FROM 'file:///relation1.csv' AS row
MATCH (a:Job {name: row.id})
MATCH (b:Education {name: row.education})
MERGE (a)-[:NEED]->(b);

LOAD CSV WITH HEADERS FROM 'file:///relation1.csv' AS row
MATCH (a:Job {name: row.id})
MATCH (b:Salary {name: row.salary})
MERGE (a)-[:OFFER]->(b);

添加 idskilldutycharacter 之间的关系

Cypher 复制代码
LOAD CSV WITH HEADERS FROM 'file:///relation_characters.csv' AS row
MATCH (a:Job {name: row.id})
MATCH (b:Characters {name: row.character})
MERGE (a)-[:REQUIRE]->(b);

LOAD CSV WITH HEADERS FROM 'file:///relation_skills.csv' AS row
MATCH (a:Job {name: row.id})
MATCH (b:Skills {name: row.skill})
MERGE (a)-[:MASTER]->(b);

LOAD CSV WITH HEADERS FROM 'file:///relation_duties.csv' AS row
MATCH (a:Job {name: row.id})
MATCH (b:Duties {name: row.duty})
MERGE (a)-[:RESPONSIBEL]->(b);

idduty 之间的关系

相关推荐
GISer_Jing12 分钟前
AI自动化工作流:智能驱动未来(升级研究生项目!!!)
人工智能·前端框架·自动化
草捏子13 分钟前
Agent Skills:让 AI 一次学会、永远记住的能力扩展方案
人工智能
NocoBase22 分钟前
【2.0 教程】第 1 章:认识 NocoBase ,5 分钟跑起来
数据库·人工智能·开源·github·无代码
后端小肥肠28 分钟前
OpenClaw实战|从识图到公众号内容自动化,我跑通了完整链路
人工智能·aigc·agent
Elastic 中国社区官方博客42 分钟前
快速 vs. 准确:衡量量化向量搜索的召回率
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索
qq_381338501 小时前
【技术日报】2026-03-18 AI 领域重磅速递
大数据·人工智能
NocoBase1 小时前
开源项目管理工具选型指南(2026年最新)
人工智能·开源·无代码
feasibility.1 小时前
AI 爬虫高手养成:Openclaw+Scrapling 手动部署 + 采集策略(以Walmart 电商平台为例)
人工智能·爬虫·科技·机器人·agi·openclaw·scrapling
程序员老猫1 小时前
前端菜鸡狂喜!DeepSeek+Gemini,嘴炮出完整博客方案
人工智能
AI周红伟2 小时前
周红伟:《OpenClaw安全防控:OpenClaw++Skills智能体安全部署、实操和企业应用实操》
人工智能·阿里云·云计算·腾讯云·openclaw