文章目录
前言-场景
这里用大家都了解的关系数据与图数据据库对比着说,更加方便大家理解图数据库的作用
图形数据库 和关系数据库 均存储信息并表示数据之间的关系。但是,关系模型优先考虑数据实体,而图形模型优先考虑实体之间的关系。即关系数据库擅长处理具有明确定义 的表间关系的结构化数据,此类数据库在跨多个表执行复杂的筛选、聚合和联接时特别有效。图形数据库有助于处理复杂的互连和查询,因为它们可以理解数据之间的关系。图形遍历算法来查询图形数据模型,这些算法采用深度优先或广度优先形式,这有助于快速查找和检索连接的数据。
一、Neo4j概述
Neo4j是一个高性能的、基于Java的图数据库,它使用原生图存储和检索技术来高效地管理数据。Neo4j中的数据以节点(Nodes)和关系(Relationships)的形式存储,每个节点和关系都可以拥有属性(Properties),这使得Neo4j在处理复杂关系网络时表现出色。以下是其他的一些数据库:https://db-engines.com/en/ranking/graph+dbms
二、软件安装部署
1.软件下载
neo4j官网下载地址:https://neo4j.com/deployment-center/
我这里用于学习使用neo4j,可以先使用windows版本。有无法访问官网的同学可以去我的下载资源里去下载对应版本的软件。
2.软件部署
- 解压文件,到bin目录下运行程序(需要管理员)
bash
./neo4j.bat console
- 访问浏览器查看正常访问:
3.软件使用
- 使用用户名密码登录:
bash
默认的用户名和密码均为neo4j
- 开始根据教程一步步学习
以下部分片段,全部代码可以在教程中进一步学习!
bash
CREATE (TheMatrix:Movie {title:'The Matrix', released:1999, tagline:'Welcome to the Real World'})
CREATE (Keanu:Person {name:'Keanu Reeves', born:1964})
CREATE (Carrie:Person {name:'Carrie-Anne Moss', born:1967})
CREATE (Laurence:Person {name:'Laurence Fishburne', born:1961})
CREATE (Hugo:Person {name:'Hugo Weaving', born:1960})
CREATE (LillyW:Person {name:'Lilly Wachowski', born:1967})
CREATE (LanaW:Person {name:'Lana Wachowski', born:1965})
CREATE (JoelS:Person {name:'Joel Silver', born:1952})
CREATE
(Keanu)-[:ACTED_IN {roles:['Neo']}]->(TheMatrix),
(Carrie)-[:ACTED_IN {roles:['Trinity']}]->(TheMatrix),
(Laurence)-[:ACTED_IN {roles:['Morpheus']}]->(TheMatrix),
(Hugo)-[:ACTED_IN {roles:['Agent Smith']}]->(TheMatrix),
(LillyW)-[:DIRECTED]->(TheMatrix),
(LanaW)-[:DIRECTED]->(TheMatrix),
(JoelS)-[:PRODUCED]->(TheMatrix)
CREATE (Emil:Person {name:"Emil Eifrem", born:1978})
CREATE (Emil)-[:ACTED_IN {roles:["Emil"]}]->(TheMatrix)
CREATE (TheMatrixReloaded:Movie {title:'The Matrix Reloaded', released:2003, tagline:'Free your mind'})
CREATE
(Keanu)-[:ACTED_IN {roles:['Neo']}]->(TheMatrixReloaded),
(Carrie)-[:ACTED_IN {roles:['Trinity']}]->(TheMatrixReloaded),
(Laurence)-[:ACTED_IN {roles:['Morpheus']}]->(TheMatrixReloaded),
(Hugo)-[:ACTED_IN {roles:['Agent Smith']}]->(TheMatrixReloaded),
(LillyW)-[:DIRECTED]->(TheMatrixReloaded),
(LanaW)-[:DIRECTED]->(TheMatrixReloaded),
(JoelS)-[:PRODUCED]->(TheMatrixReloaded)
4.语法学习
Neo4j Cypher 查询语言
Cypher 是一种声明式图形查询语言,全球开发人员都在使用它。Cypher 由 Neo4j 创建,为属性图提供了富有表现力且高效的查询。以下是学习Neo4j的学习官网连接,建议通过官网可以更加正确快速的学习Neo4j。
- 在线学习:https://neo4j.com/product/auradb/,可以在线练习Cypher语法,导入线上案例。(需要科学上网和账号登录)
- 官网教程文档:https://neo4j.com/docs/
- Java开发文档:https://neo4j.com/docs/java-manual/current/
总结
Neo4j是图形化操作起来入手很快,深入学习则需要大量的学习了。这里再总结下Neo4j图数据库和关系型数据库的主要区别。用于让做技术选型的同学能够更好的判断应用场景。
除了采用不同的数据模型外,关系数据库和图形数据库还有许多差异,这使得它们在功能和效用存在区别。
-
可扩展性
扩展关系数据库时,通常是垂直扩展。垂直扩展是指升级硬件(例如 CPU、存储空间或内存)以增加服务器可以处理的工作负载。垂直扩展有局限性,除了成本要求外,还会带来各种问题。 关系数据库也可以使用分片进行水平扩展,即在许多服务器上分发数据。但是,分片会增加数据存储的复杂性,并可能引发一致性问题。
相比之下,图形数据库非常擅长横向扩展,并且使用分区来实现此类扩展。所有分区位于不同的服务器上,这使得许多服务器可以并行处理图形查询。通过在多个节点上分发,数据库引擎可以有效地查询数据,即使是大规模查询数据亦可轻松应对。
-
性能
图形数据库提供无索引邻接,从而提高性能。无索引邻接可让系统在相关实体之间遍历。由于图形数据库将关系存储为节点之间的引用或指针,因此数据库可以跟随内存指针在实体之间快速导航。在这种情况下,数据库不需要索引或映射表。
这种无索引邻接系统可让图形数据库实现恒定时间的关系遍历。恒定时间意味着无论数据规模如何,都可以在相同的时间量内始终如一地遍历图形数据库中的关系。节点之间的直接连接可实现即时访问,因此可以快速查询和跟踪关系。图形数据库借助这些功能实现高效操作。
另一方面,关系数据库使用索引查找,并且必须扫描表以识别实体之间的关系。可以联接多个表,但这会非常耗时,因为系统必须扫描更大的索引而非更多的数据。因此,关系数据库无法提供与图形数据库相同的性能。
-
易用性
图形数据库以关系为中心,从而可在使用连接的数据时轻松操作这些数据库。这些数据库擅长多跃点查询,在这种查询中,可以遍历具有多种关系的路径。还可以使用图形查询语言(如 Gremlin 或 Cypher)来直观地表达关系。可以使用这些语言浏览相互连接的数据,这简化了用于探索嵌套和联接数据的语法。
关系数据库使用 SQL,在管理多跃点查询时,SQL 可能会让用户感觉不自然。如果一个查询有多个联接且跨越嵌套的子查询,SQL 语句的编写就会变得困难。如果未能谨慎处理,这很容易转化为难以阅读和维护的庞大查询。
也就是说,关系数据库已经成熟,在各种使用案例中广受欢迎。可以使用多种工具和资源以及社区支持来优化系统。同样,关系数据库在以可靠且符合 ACID 的方式管理结构化数据时表现出色。ACID 属性包括原子性、一致性、隔离性和持久性,有助于确保数据的有效性。