在PAI-DSW中连接Neo4J,并批量创建知识图谱

我在 阿里云DSW实例中安装并运行Neo4J 中提到过,由于PAI-DSW的专有网络配置不能确保百分之百成功,因而很难实现通过本地的浏览器登录在PAI-DSW中启动的Neo4J图数据库。

我当时想出的一个解决办法是使用./cypher-shell语句在命令行登录neo4j,然后使用Cypher语句在命令行实现节点的增删改查。然而,如果我们想要批量创建大量的节点及关系,这种方法也很不现实。

我今天想到的一个新的解决方法是:在PAI-DSW的命令行使用./cypher-shell语句登录neo4j,然后在PAI-DSW的NoteBook中使用neo4j模块或者py2neo模块连接(在PAI-DSW的命令行中)已启动的neo4j,进行批量的节点和关系创建。这样的做法就类似于在本地的命令行启动neo4j,然后再在本地的NoteBook中使用neo4j模块或py2neo模块连接(本地命令行中启动的)neo4j,在命令行和NoteBook中登录的neo4j都处于同一局域网中。

除了需要命令行和Notebook都处于同一局域网中,该方案的另一个前提 是:命令行和Notebook都需要使用同一个Python环境,具体做法详见博客 PAI-DSW中对齐NoteBook和命令行的Python环境

1. 在命令行登录neo4j

(1)先使用下面的代码启动neo4j

python 复制代码
neo4j start

运行结果如下:

(2)然后进入neo4j安装文件夹的bin文件,运行./cypher-shell,并输入用户名和密码进行登录。

运行结果如下:

(3)使用Cypher语句查询所登录的Neo4J的图数据库中的节点数量(方便之后验证)

python 复制代码
MATCH(n) RETURN count(n) AS totalNodes

运行结果如下:

2. 在NoteBook中使用neo4j模块连接neo4j图数据库

python 复制代码
from neo4j import GraphDatabase

class Neo4jService(object):
    def __init__(self, uri, auth):
        self._driver = GraphDatabase.driver(uri, auth = auth)

    def close(self):
        self._driver.close()

    def run_query(self, query):
        with self._driver.session() as session:
            result = session.run(query)
            return result.values()

username = 'neo4j'
password = 'xxxx' # your password
auth = (username, password)
neo4j = Neo4jService("bolt://localhost:7687", auth)
answer1 = 'MATCH(n) RETURN count(n) AS totalNodes'
result = neo4j.run_query(answer1)

上面的代码运行结果如下,可知在NoteBook中能连接在命令行中启动的那个neo4j数据库。

然后使用neo4j.close()关闭与数据库的连接。

3. 在NoteBook中使用py2neo模块连接neo4j图数据库

(1)使用下面的代码先连接neo4j数据库,然后再新增一个节点

python 复制代码
from py2neo import Graph,Node,Relationship,NodeMatcher

graph=Graph("bolt://localhost:7687", auth = auth) #连接

book_node=Node('经名',name='十三经') 
graph.create(book_node) #新增节点

(2)在命令行查看节点数是否加1

这是的节点总数变成了32,较之之前多一个,所以py2neo也是能成功连接neo4j的。

在NoteBook中使用neo4j模块或py2neo模块连接neo4j数据库的过程中需要注意的是,命令行中start的neo4j数据库要一直保持运行状态

PS:

在后面使用p2neo批量创建节点和关系的时候,需要调用到xlrd第三方库,碰到了如下报错:

XLRDError: Excel xlsx file; not supported

参考博客 python xlrd库报错AttributeError 进行了解决。

最后使用py2neo迅速地创建了1000多个节点。关于如何使用py2neo批量创建节点,我这里就不再介绍了,网上也很多相关的代码。

相关推荐
qcx231 小时前
【系统学AI】25 论文导读 ①:两篇改变 AI 的开山之作——Attention Is All You Need & ReAct
前端·人工智能·react.js·transformer
Black蜡笔小新1 小时前
自动化AI算法训练服务器DLTM制造业AI质检工作站助力制造业实现AI智检
人工智能·算法·自动化
川冰ICE1 小时前
⑮ AI音乐与音频:工具详解与创作流程
人工智能·音视频
米小虾1 小时前
2026 年多模态大模型全面爆发:从「看懂图」到「听懂世界」的技术跃迁
人工智能
米小虾1 小时前
AI Agent 进入协议时代:MCP、A2A、AG-UI 三大协议全景解析
人工智能·agent
蝎子莱莱爱打怪1 小时前
🚀 🚀🚀2026年5月GitHub月榜精选:17个项目中挑出10个推荐,实操4个!
人工智能·后端·ai编程
升鲜宝供应链及收银系统源代码服务2 小时前
升鲜宝AI助手项目源码集成开发步骤(一)---升鲜宝生鲜配送供应链管理系统源代码服务
人工智能·生鲜配送系统·生鲜物流线路规划·生鲜电商订单系统·生鲜供应链系统·生鲜系统架构设计·生鲜配送ai功能集成
yjcode7892 小时前
探索游戏充值新纪元:友价源码技术革新之旅
大数据·人工智能·游戏·游戏交易
冬奇Lab2 小时前
Agent 系列(11):A2A 协议——Agent 与 Agent 如何协作
人工智能·agent
snow@li2 小时前
AI:理解 大数据、算法、算力、电力、生成式AI、token 之间的关系
大数据·人工智能·算法