HBase介绍、特点、应用场景、生态圈

目录:
一、HBase简介
二、NoSQL和关系型数据库对比
三、HBase特点
四、应用场景
五、HBase生态圈技术

一、HBase简介

HBase是一个领先的NoSQL数据库

是一个面向列存储的NoSQL数据库

是一个分布式Hash Map,底层数据是Key-Value格式

基于Coogle Big Table论文

使用HDFS作为存储并利用其可靠性

二、NoSQL和关系型数据库对比

对比 NoSQL 关系型数据库
常用数据库 HBase、MongoDB、Redis Oracle、DB2、MySQL
存储格式 文档、键值对、图结构 表格式,行和列
存储范围 鼓励冗余 规范性,避免重复
存储扩展 横向扩展、分布式 纵向扩展(横向扩展有限)
查询方式 非结构化查询 结构化查询语句SQL
事务 不支持事务一致性 支持事务
性能 读写性能高 读写性能差
成本 简单易部署,开源,成本低 成本高

三、HBase特点

  • 数据访问速度快,相应时间约2-20毫秒

  • 支持随机读写,每个节点20k~100k+ops/s

  • 可拓展性,可拓展到20000+节点

  • 高并发

四、应用场景

  1. 增量数据-时间序列数据
    高容量,高速写入
    HBase之上有OpenTSDB模块,可以满足时序类场景,比如传感器,系统监控,股票行情监控等
  2. 信息交换-消息传递
    高容量,高速读写
    通信、消息同步的应用构建在HBase之上,比如:email,FaceBook等
  3. 内容服务-Web后端应用程序
    高容量,高速读写
    头条类、新闻类的新闻、网页、图片、图片存储在HBase中

五、HBase生态圈技术

名称 介绍
Lily 基于HBase的CRM
OpenTSDB HBase面向时间序列数据管理
Kylin HBase上的OLAP
Phoenix SQL操作HBase工具
Splice Machine 基于HBase的OLTP
Apache Tophra HBase事务支持
TiDB 分布式SQL DB
Apache Omid 优化事务管理
Yarn application timeline server v.2迁移到HBase
Hive metadata存储可以迁移到HBase
Ambari Metrics Server 将使用HBase做数据存储
相关推荐
不羁。。3 小时前
【撸靶笔记】第七关:GET - Dump into outfile - String
数据库·笔记·oracle
更深兼春远3 小时前
flink+clinkhouse安装部署
大数据·clickhouse·flink
yangchanghua1115 小时前
pgsql 如何查询今天范围内的数据(当天0点0分0秒 - 当天23点59分59秒....)
数据库·pgsql
larance5 小时前
SQLAlchemy 的异步操作来批量保存对象列表
数据库·python
python_chai5 小时前
从数据汇总到高级分析,SQL 查询进阶实战(下篇)—— 分组、子查询与窗口函数全攻略
数据库·sql·mysql
在努力的前端小白5 小时前
Spring Boot 敏感词过滤组件实现:基于DFA算法的高效敏感词检测与替换
java·数据库·spring boot·文本处理·敏感词过滤·dfa算法·组件开发
未来之窗软件服务5 小时前
自建知识库,向量数据库 (九)之 量化前奏分词服务——仙盟创梦IDE
数据库·仙盟创梦ide·东方仙盟·自建ai·ai分词
专注API从业者7 小时前
Python + 淘宝 API 开发:自动化采集商品数据的完整流程
大数据·运维·前端·数据挖掘·自动化
媒体人8888 小时前
GEO 优化专家孟庆涛:技术破壁者重构 AI 时代搜索逻辑
大数据·人工智能
最初的↘那颗心8 小时前
Flink Stream API 源码走读 - print()
java·大数据·hadoop·flink·实时计算