目录
[1.1 获取数据集](#1.1 获取数据集)
[1.2 以"记事本"方式打开文件](#1.2 以“记事本”方式打开文件)
[1.3 另存为"UTF-8"格式文件](#1.3 另存为“UTF-8”格式文件)
[1.4 选择"是"](#1.4 选择“是”)
[二、 打开Neo4j并运行](#二、 打开Neo4j并运行)
[2.1 创建新的Neo4j数据库](#2.1 创建新的Neo4j数据库)
[2.2 分别设置数据库名和密码](#2.2 分别设置数据库名和密码)
[编辑 2.3 启动Neo4j数据库](#编辑 2.3 启动Neo4j数据库)
[2.4 打开Neo4j数据库](#2.4 打开Neo4j数据库)
[2.5 运行查看该数据库是否为空](#2.5 运行查看该数据库是否为空)
[3.1 创建一个包,存项目](#3.1 创建一个包,存项目)
[3.2 创建一个项目](#3.2 创建一个项目)
[3.3 检查自己的依赖是否完全](#3.3 检查自己的依赖是否完全)
[3.3.1 点击"File"-"Settings"](#3.3.1 点击“File”-“Settings”)
[3.3.2 找到"Project:PythonProject"-"Python Interpreter"](#3.3.2 找到“Project:PythonProject”-"Python Interpreter")
[3.4 导入相关依赖,打开Terminal](#3.4 导入相关依赖,打开Terminal)
[3.5 输入命令](#3.5 输入命令)
[4.1 Python连接Neo4j测试](#4.1 Python连接Neo4j测试)
[4.2 导入数据集](#4.2 导入数据集)
[4.3 处理数据集](#4.3 处理数据集)
[4.4 初始化neo4j并合并数据集关系](#4.4 初始化neo4j并合并数据集关系)
[4.5 把节点导入到Neo4j中](#4.5 把节点导入到Neo4j中)
[4.6 运行代码后,查看Neo4j是否有节点](#4.6 运行代码后,查看Neo4j是否有节点)
[4.7 导入节点关系](#4.7 导入节点关系)
[4.8 查看Neo4j](#4.8 查看Neo4j)
[5.1 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid continuation byte](#5.1 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid continuation byte)
一、获取数据集
1.1 获取数据集
《我是刑警》的人物关系数据集资源https://download.csdn.net/download/Z0412_J0103/90160496
data:image/s3,"s3://crabby-images/eba23/eba239b7c37a1ee5b70b53cfc17942b4c72cc34d" alt=""
1.2 以"记事本"方式打开文件
data:image/s3,"s3://crabby-images/faaab/faaabf40316425c3edb114f7845e6323435dd7a9" alt=""
1.3 另存为"UTF-8"格式文件
data:image/s3,"s3://crabby-images/02ad9/02ad9fe93f95186be8bd01070135d19f7aa7f07f" alt=""
1.4 选择"是"
data:image/s3,"s3://crabby-images/1280e/1280e64812293686124efcf34e3db55f6ee9db17" alt=""
二、 打开Neo4j并运行
2.1 创建新的Neo4j数据库
data:image/s3,"s3://crabby-images/63539/635396c914ecce276fee4761184b8c68f88c9983" alt=""
2.2 分别设置数据库名和密码
2.3 启动Neo4j数据库
data:image/s3,"s3://crabby-images/05c4e/05c4e2f70f3041d91b881924c8205419ce02d85d" alt=""
2.4 打开Neo4j数据库
data:image/s3,"s3://crabby-images/c1052/c1052833e438914fe75c9121d80601ffab2e85f4" alt=""
2.5 运行查看该数据库是否为空
python
match(n) return n;
data:image/s3,"s3://crabby-images/ce975/ce9752c5c5055bdbfba61e2ab921c27a8f354920" alt=""
data:image/s3,"s3://crabby-images/e06c5/e06c583e79891bf4259b688f6169318b30876971" alt=""
三、打开Python创建项目
3.1 创建一个包,存项目
data:image/s3,"s3://crabby-images/eae80/eae8033b3507241a85c092bf3e501faa5407b50b" alt=""
3.2 创建一个项目
data:image/s3,"s3://crabby-images/bf359/bf3594095cc9d55ef3f47248f99a96a9198b8aba" alt=""
3.3 检查自己的依赖是否完全
3.3.1 点击"File"-"Settings"
data:image/s3,"s3://crabby-images/26a8e/26a8e55c576d13466a24b0352fd043405ef80514" alt=""
3.3.2 找到"Project:PythonProject"-"Python Interpreter"
检查是否导入了"neo4j"、"pandas"、"py2neo"
data:image/s3,"s3://crabby-images/41ed8/41ed8e874058165f59b0ef0b92671ffd4a878a97" alt=""
3.4 导入相关依赖,打开Terminal
data:image/s3,"s3://crabby-images/6e2f7/6e2f71c9d477f242a0fb1af8a6862ec7d929bf8c" alt=""
3.5 输入命令
python
pip install neo4j-python-driver pandas py2neo
data:image/s3,"s3://crabby-images/fb874/fb874ae50e9f0ce7fc05249192911014e3a77934" alt=""
四、实现Python连接Neo4j
4.1 Python连接Neo4j测试
pythonfrom py2neo import * import pandas as pd from neo4j import GraphDatabase graph = Graph('http://neo4j:123456@127.0.0.1:7474')
其中的"123456"是你刚刚建立的Neo4j密码,此处只需要修改该密码就可以了
data:image/s3,"s3://crabby-images/2c450/2c4502d27cb0c448ce2f9b9c3d5d9811f8733179" alt=""
4.2 导入数据集
pythoninvoice_data = pd.read_csv("D:/我是刑警.csv", header=0) print(invoice_data.shape)
其中地址需要改变,其它地方都不用变
运行结果如下
data:image/s3,"s3://crabby-images/45155/45155d95bab101868eeee73a869e5a7aba88e7fa" alt=""
4.3 处理数据集
pythonpeoples = list(set(invoice_data['人物'].astype(str))) people_ties = list(set(invoice_data['关系人物'].astype(str))) people = list(set(peoples).union(set(people_ties))) print(people) # 清除neo4j里面的所有数据 graph.delete_all()
执行结果如下
data:image/s3,"s3://crabby-images/0de64/0de644d16d68d61508db46b462034e0d68fccd81" alt=""
4.4 初始化neo4j并合并数据集关系
python
# 初始化一个空列表来存储所有的元组
tuple_total = []
# 迭代DataFrame的每一行
for index, row in invoice_data.iterrows():
ties_total = [row['人物'], row['关系'], row['关系人物']]
# 将所有元组添加到结果列表中
tuple_total.extend([ties_total])
print(tuple_total)
data:image/s3,"s3://crabby-images/f3b24/f3b24bfe061f2451e67863f33c4642129da1c0a1" alt=""
4.5 把节点导入到Neo4j中
python
#把节点导入neo4j中
def create_node(people):
for name in people:
node_1 = Node('人物', name = name)
graph.create(node_1)
create_node(people)
data:image/s3,"s3://crabby-images/d6481/d64813ee279128eb2ab28bc7df77aa55e185d023" alt=""
4.6 运行代码后,查看Neo4j是否有节点
4.7 导入节点关系
python
matcher = NodeMatcher(graph)
# 导入关系
for i in range(0, len(tuple_total)):
name_1 = matcher.match('人物', name=tuple_total[i][0]).first()
name_2 = matcher.match('人物', name=tuple_total[i][2]).first()
rel = tuple_total[i][1]
relationship = Relationship(name_1, rel, name_2)
graph.create(relationship)
data:image/s3,"s3://crabby-images/79e04/79e044abe94db5204a9920eabde3b23e3a653945" alt=""
4.8 查看Neo4j
五、该过程出现的Bug
5.1 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid continuation byte
data:image/s3,"s3://crabby-images/74e2b/74e2b4bad33687de281cb431ec05f68ca5c234fc" alt=""
解决过程:
是因为你的CSV文件没有设置为"UTF-8" ,具体过程看本文的1.2和1.3过程
data:image/s3,"s3://crabby-images/bea72/bea726fc82207d52ee1d5f3906d6a6e8b9089458" alt=""
上一篇文章:CSDN中群发功能及自动回复设置教程_csdn粉丝群发https://blog.csdn.net/Z0412_J0103/article/details/144074981下一篇文章: