Apache HBase

一、HBase简介

1、HBase定义

Apache HBase™是以hdfs为数据存储的,一种分布式、可扩展的NoSQL数据库。

HBase官网

javascript 复制代码
Welcome to Apache HBase™
Apache HBase™ is the Hadoop database, a distributed, scalable, big data store.

Use Apache HBase™ when you need random, realtime read/write access to your Big Data. 
This project's goal is the hosting of very large tables -- billions of rows X millions 
of columns -- atop clusters of commodity hardware. Apache HBase is an open-source,
 distributed, versioned, non-relational database modeled after Google's Bigtable: 
A Distributed Storage System for Structured Data by Chang et al. Just as Bigtable 
leverages the distributed data storage provided by the Google File System, Apache 
HBase provides Bigtable-like capabilities on top of Hadoop and HDFS.

billions of rows X millions of columns:数十亿行X数百万列

2、HBase数据模型

HBase 的设计理念依据Google的BigTable论文,论文中对于数据模型的首句介绍。 Bigtable 是一个稀疏的、分布式的、持久的多维排序map。

之后对于映射的解释如下:

该映射由行键、列键和时间戳索引;映射中的每个值都是一个未解释的字节数组。

最终HBase关于数据模型和BigTable的对应关系如下:

HBase使用与Bigtable非常相似的数据模型。用户将数据行存储在带标签的表中。数据行具有可排序的键和任意数量的列。该表存储稀疏,因此如果用户喜欢,同一表中的行可以具有疯狂变化的列。

最终理解HBase数据模型的关键在于稀疏、分布式、多维、排序的映射。其中映射map

指代非关系型数据库的key-Value结构。

Hadoop分布式文件系统(一)

请记住,你当下的结果,由过去决定;你现在的努力,在未来见效;
不断学习才能不断提高!磨炼,不断磨炼自己的技能!学习伴随我们终生!
生如蝼蚁,当立鸿鹄之志,命比纸薄,应有不屈之心。
乾坤未定,你我皆是黑马,若乾坤已定,谁敢说我不能逆转乾坤?
努力吧,机会永远是留给那些有准备的人,否则,机会来了,没有实力,只能眼睁睁地看着机会溜走。

相关推荐
gma9992 分钟前
Etcd 框架
数据库·etcd
爱吃青椒不爱吃西红柿‍️4 分钟前
华为ASP与CSP是什么?
服务器·前端·数据库
PersistJiao21 分钟前
在 Spark RDD 中,sortBy 和 top 算子的各自适用场景
大数据·spark·top·sortby
2301_8112743133 分钟前
大数据基于Spring Boot的化妆品推荐系统的设计与实现
大数据·spring boot·后端
Yz987640 分钟前
hive的存储格式
大数据·数据库·数据仓库·hive·hadoop·数据库开发
青云交40 分钟前
大数据新视界 -- 大数据大厂之 Hive 数据导入:多源数据集成的策略与实战(上)(3/ 30)
大数据·数据清洗·电商数据·数据整合·hive 数据导入·多源数据·影视娱乐数据
武子康44 分钟前
大数据-230 离线数仓 - ODS层的构建 Hive处理 UDF 与 SerDe 处理 与 当前总结
java·大数据·数据仓库·hive·hadoop·sql·hdfs
武子康1 小时前
大数据-231 离线数仓 - DWS 层、ADS 层的创建 Hive 执行脚本
java·大数据·数据仓库·hive·hadoop·mysql
苏-言1 小时前
Spring IOC实战指南:从零到一的构建过程
java·数据库·spring
Ljw...1 小时前
索引(MySQL)
数据库·mysql·索引