目录:
一、HBase简介
二、NoSQL和关系型数据库对比
三、HBase特点
四、应用场景
五、HBase生态圈技术
一、HBase简介
HBase是一个领先的NoSQL数据库
是一个面向列存储的NoSQL数据库
是一个分布式Hash Map,底层数据是Key-Value格式
基于Coogle Big Table论文
使用HDFS作为存储并利用其可靠性
二、NoSQL和关系型数据库对比
对比 | NoSQL | 关系型数据库 |
---|---|---|
常用数据库 | HBase、MongoDB、Redis | Oracle、DB2、MySQL |
存储格式 | 文档、键值对、图结构 | 表格式,行和列 |
存储范围 | 鼓励冗余 | 规范性,避免重复 |
存储扩展 | 横向扩展、分布式 | 纵向扩展(横向扩展有限) |
查询方式 | 非结构化查询 | 结构化查询语句SQL |
事务 | 不支持事务一致性 | 支持事务 |
性能 | 读写性能高 | 读写性能差 |
成本 | 简单易部署,开源,成本低 | 成本高 |
三、HBase特点
-
数据访问速度快,相应时间约2-20毫秒
-
支持随机读写,每个节点20k~100k+ops/s
-
可拓展性,可拓展到20000+节点
-
高并发
四、应用场景
- 增量数据-时间序列数据
高容量,高速写入
HBase之上有OpenTSDB模块,可以满足时序类场景,比如传感器,系统监控,股票行情监控等 - 信息交换-消息传递
高容量,高速读写
通信、消息同步的应用构建在HBase之上,比如:email,FaceBook等 - 内容服务-Web后端应用程序
高容量,高速读写
头条类、新闻类的新闻、网页、图片、图片存储在HBase中
五、HBase生态圈技术
名称 | 介绍 |
---|---|
Lily | 基于HBase的CRM |
OpenTSDB | HBase面向时间序列数据管理 |
Kylin | HBase上的OLAP |
Phoenix | SQL操作HBase工具 |
Splice Machine | 基于HBase的OLTP |
Apache Tophra | HBase事务支持 |
TiDB | 分布式SQL DB |
Apache Omid | 优化事务管理 |
Yarn | application timeline server v.2迁移到HBase |
Hive | metadata存储可以迁移到HBase |
Ambari | Metrics Server 将使用HBase做数据存储 |