NoSql非关系型数据库

前言:Nosql = not only sql,意即"不仅仅是sql",泛指非关系型数据库。这些类型的数据存储不需要固定的模式(当然也有固定的模式),无需多余的操作就可以横向扩展。NoSql数据库中的数据是使用聚合模型来进行处理的,聚合模型主要分为:KV键值对,BSON,列族,图形,时序,向量等几种数据库结构。常见的NoSQL数据库有redis、MongoDB、Memcache、HBase、Clickhouse、Doris、Starlocks、Hive、BigTable、Cassandra、CouchDB、Neo4J、InfluxDBX、Prometheus等。


1、 数据库共有2种类型

关系型数据库和非关系型数据库

(1)关系数据库

MySQL、MariaDB(MySQL的代替品)、PostgreSQL、Microsoft Access、Google Fusion Tables、SQLite、DB2、FileMaker、Oracle、SQL Server、INFORMIX、Sybase、dBASE、Clipper、FoxPro、foshub。

几乎所有的数据库管理系统都配备了一个开放式数据库连接(ODBC)驱动程序,令各个数据库之间得以互相集成。

(2)非关系型数据库(NoSQL)

redis、MongoDB、Memcache、HBase、Clickhouse、Doris、Starlocks、Hive、BigTable、Cassandra、CouchDB、Neo4J、InfluxDBX、Prometheus


2、关系型数据库和非关系型数据库的区别

(1)关系型数据库最典型的数据结构是表,由二维表及其之间的联系所组成的一个数据组织

优点:

  • 易于维护:都是使用表结构,格式一致;

  • 使用方便:SQL语言通用,可用于复杂查询;

  • 复杂操作:支持SQL,可用于一个表以及多个表之间非常复杂的查询。

缺点:

  • 读写性能比较差,尤其是海量数据的高效率读写;

  • 固定的表结构,灵活度稍欠;

  • 高并发读写需求,传统关系型数据库来说,硬盘I/O是一个很大的瓶颈。

(2)非关系型数据库严格上不是一种数据库,应该是一种数据结构化存储方法的集合,可以是文档或者键值对等。

优点:

  • 格式灵活:存储数据的格式可以是key,value形式、文档形式、图片形式等等,文档形式、图片形式等等,使用灵活,应用场景广泛,而关系型数据库则只支持基础类型。

  • 速度快:nosql可以使用硬盘或者随机存储器作为载体,而关系型数据库只能使用硬盘;

  • 高扩展性;

  • 成本低:nosql数据库部署简单,基本都是开源软件。

缺点:

  • 不提供sql支持,学习和使用成本较高;

  • 无事务处理;

  • 数据结构相对复杂,复杂查询方面稍欠。


3、NoSql数据库是什么?

NoSQL(Not only SQL)是对不同于传统的关系数据库的数据库管理系统的统称,即广义地来说可以把所有不是关系型数据库的数据库统称为NoSQL。

NoSQL 数据库专门构建用于特定的数据模型,并且具有灵活的架构来构建现代应用程序。NoSQL 数据库使用各种数据模型来访问和管理数据。这些类型的数据库专门针对需要大数据量、低延迟和灵活数据模型的应用程序进行了优化,这是通过放宽其他数据库的某些数据一致性限制来实现的。

数十年来,用于应用程序开发的主要数据模型是由关系数据库(如 Oracle、DB2、SQL Server、MySQL 和 PostgreSQL)使用的关系数据模型。直到近十几年,才开始大规模采用和使用其他数据模型。为了对这些新类别的数据库和数据模型进行区分和分类,创造了术语"NoSQL"。通常术语"NoSQL"与"非关系"可互换使用。


4、NoSql数据结构类型

NoSql中的数据是使用聚合模型来进行处理的。聚合模型主要分为:KV键值对,BSON,列族,图形等几种方式

  • KV键值对:就是我们平常使用的map那样的存储模式

  • BSON:在MongoDB中常用的一种数据类型,是一种类json的一种二进制形式的存储格式,简称binary json,它和json一样,支持内嵌的文档对象和数组对象

  • 列族:按列存储数据。最大的特点是方便存储结构和半结构化数据,方便做数据压缩,对针对某一列或者是某几列的查询有非常大的IO优势

  • 图形:不是放图形的,放的是关系,比如:朋友圈社交网络,广告推荐系统等,专注于构建关系图谱


5、NoSql数据库的分类

(1)KV键值对数据库

临时性键值存储:Memcached,Redis

永久性键值存储:ROMA,Redis

应用场景:内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统等等

数据模型:Key指向Value的键值对,通常用HashTable来实现

优点:查找速度快

缺点:数据无结构化,通常只被当做字符串或者是二进制数据

(2)面向文档的数据库:MongoDB,CouchDB

Mongodb是一个基于分布式文件存储的数据库,由c++语言编写。 为web应用提供可扩展的高性能数据存储解决方案,是一个介于关系数据库和非关系数据库之间的产品,是非关系数据中功能最丰富,最像关系数据库的

应用场景:WEB应用(与key-value类似,value是结构化的,不同的是数据库能够了解到value的内容)

数据模型:Key-Value对应的键值对,Value是结构化的数据

优点:数据结构要求不严格,表结构可变,不需要像关系型数据库一样需要预先定义表结构

缺点:查询性能不高,而且缺乏统一的查询语法

(3)面向列的数据库:Cassandra,HBase

应用场景:分布式的文件系统

数据模型:以列簇式存储,将一列数据存储在一起

优点:查找速度快,可扩展性强,更容易进行分布式扩展

缺点:功能相对局限

(4)面向图形的数据库:Neo4J,InfoGrid

应用场景:社交网络,推荐系统等,专注于构建关系图谱

数据模型:图结构

优点:利用图结构相关算法。比如最短路径寻址,N度关系查找等等。

缺点:很多时候要对整个图做计算才能得出需要的信息,而且这种结构不太好做分布式的集群方案。


6、NoSql数据库的优点

  • **易扩展:**nosql数据库种类繁多,但是一个共同的特点都是去掉关系型数据库的关系型特性数据之间无关系,这样就非常容易扩展,也无形之间,在架构层面上带来了可扩展的能力

  • **大数据量高性能:**Nosql数据库都具有非常高的读写能力,尤其在大数据量下,同样表现优秀,这得益于它的无关系型,数据库的结构简单,一般mysql使用query cache,每次表的更新cache就会失效,这是一种大粒度的cache,在针对web2.0的交互频繁的应用,cache性能不高,而nosql的cache是记录级的,是一种细粒度的cache,所以nosql在这个层面上来说就要性能高很多了

  • **多样灵活的数据模型:**Nosql无需事先为要存储的数据建立字段,随时可以存储自定义的数据格式,而在关系数据库里,增删字段是一件非常麻烦的事情,如果是非常大数据量的表,增加字段简直就是一个噩梦


7、关系型数据库和非关系型数据库的对比

既然Oracle,MySQL等传统的关系型数据库非常成熟并且已经大规模的商用,为什么还要用NoSql呢?

主要是由于随着互联网的发展,数据量越来越大,对性能的要求越来越高,传统数据库存在着先天性的缺陷,即单机(单库)性能瓶颈,并且扩展困难。这样既有单机瓶颈,却又扩展困难,自然无法满足日益增长的海量数据存储及其性能要求,所以才会出现各种各样的NoSql产品,NoSql的根本性优势在于云计算时代,简单,易于大规模分布式扩展,并且读写性能极高。

看下两者的对比:


参考链接:

NoSQL数据库简介 - 知乎