什么是HBase
HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据。
访问层次(数据库结构)
访问接口
1.Native Java APl,最常规和高效的访问方式,适合Hadoop MapReduce Job并行批处理HBase表数据
2.HBase Shel, HBase的命令行工具,最简单的接口,适合HBase管理使用
- Thrift Gateway,利用Thrift序列化技术,支持C++,PHP, Python等多种语言,适合其他异构系统在线访问HBase
表数据
4.REST Gateway,支持REST风格的Htp API访同HBase,解除了语言限制
5.Pig,可以使用Pig Latin流式编程语言来操作HBase中的数据,和Hive类似,本质最终也是编译成MapReduce Job来
处理HBase表数据,适合做数据统计
6.Hive,当前Hive的Release版本尚已经加入对HBase的支持,可以使用类似SQL语言来访问HBase