hbase

march of Time2 天前
hive·mongodb·hbase
hbase mongodb hive starrocks比较本文是在学习大数据的几个数据存储系统相关的组件所记录下来的,主要是不同组件的基础概念初步了解与对比。在大数据时代,虽然RDBMS很优秀,但是面对快速增长的数据规模和日渐复杂的数据模型,RDBMS渐渐力不从心,无法应对很多数据库处理任务,这时NoSQL凭借易扩展、大数据量和高性能以及灵活的数据模型成功的在数据库领域站稳了脚跟。Nosql无需实现为数据定义一个模式,可以更灵活地适配各种数据。
万叶学编程2 天前
java·数据库·hbase
HBase 开发:使用Java操作HBaseHBase和Hadoop一样,都是用Java进行开发的,本次实训我们就来学习如何使用Java编写代码来操作HBase数据库。
Apache IoTDB4 天前
运维·数据库·hbase·时序数据库·iotdb·opentsdb
替换OpenTSDB和HBase,宝武集团使用IoTDB助力钢铁设备智能运维时序数据库 IoTDB 应用于宝武集团全基地钢铁时序数据管理,激活数据资产,赋能大型设备智能运维。宝武装备智能科技有限公司(以下简称:宝武智维)是中国宝武设备智能运维专业化平台公司,30 余年始终专注于钢铁行业设备技术服务,逐步打通检测、诊断、检修、制造等设备服务环节,形成系统解决方案服务模式,希望为用户提供稳定可靠、智能高效的设备运行保障。
bigdata-余建新4 天前
数据库·python·hbase
HBase压测 ycsbhbase建表语句 https://github.com/brianfrankcooper/YCSB/tree/master/hbase2
罗亚方舟4 天前
大数据·数据库·hbase
统计HBase表记录条数的方法一、hbase-shell的count命令这是最简单直接的操作,但是执行效率非常低,适用于百万级以下的小表RowCount统计!
小C哈哈哈4 天前
大数据·数据仓库·hadoop·hdfs·hbase·mapreduce·database
大数据技术之HBase中的HRegion如果你正在学习大数据,你应该知道HBase是一个列式存储的NoSQL分布式数据库,可以配合Hadoop来使用。今天自己简单做了几页PPT,解释了一下HBase当中HRegion的基本概念,很多初学者在学习的时候对HRegion这个概念一直懵懵懂懂,今天一键搞定~
Mephisto.java5 天前
大数据·sql·oracle·sqlite·json·hbase·database
【大数据学习 | HBASE高级】hbase的参数优化Zookeeper 会话超时时间属性:zookeeper.session.timeout 解释:默认值为 90000 毫秒(90s) hbase.client.pause(默认值 100ms)重试间隔 hbase.client.retries.number(默认 15 次)重试次数
Mephisto.java6 天前
大数据·sql·oracle·sqlite·json·hbase
【大数据学习 | HBASE高级】hbase-phoenix 与二次索引应用上面我们学会了hbase的操作和原理,以及外部集成的mr的计算方式,但是我们在使用hbase的时候,有的时候我们要直接操作hbase做部分数据的查询和插入,这种原生的方式操作在工作过程中还是比较常见的,以上这些方式需要使用外部的框架进行协助处理,其实hbase也对外提供了一个直接的操作方式接口插件Phoenix,它和mr不一样,是直接集成在hbase之中的,通过一个工具使得hbase可以完全支持sql操作,其实我们可以将Phoenix当成是一个sql插件,一个可以写sql完成hbase操作的插件,并且在h
Matrix707 天前
大数据·数据库·hbase
HBase理论_HBase架构组件介绍近来有些空闲时间,正好最近也在开发HBase相关内容,借此整理一下学习和对HBase组件的架构的记录和个人感受,付出了老夫不少心血啊,主要介绍的就是HBase的架构设计以及我的拓展内容。内容如有不当或有其他理解
不太灵光的程序员7 天前
数据库·分布式·hbase
【HBase分布式数据库】第七章 数据的导入导出 importtsv导入数据第七章 数据的导入导出任务目的 掌握导入tsv数据的方法 掌握导入csv数据的方法 任务清单 任务1:导入tsv数据 任务2:导入csv数据
Mephisto.java7 天前
数据库·学习·hbase
【大数据学习 | HBASE高级】region split机制和策略HRegionServer拆分region的步骤是,先将该region下线,然后拆分,将其子region加入到hbase:meta表中,再将他们加入到原本的HRegionServer中,最后汇报Master。
Mephisto.java7 天前
大数据·学习·hbase
【大数据学习 | HBASE】hbase的读数据流程与hbase读取数据在解析读取流程之前我们还需要知道两个功能性的组件和HFIle的格式信息HFILE存储在hdfs中的hbase文件,这个文件中会存在hbase中的数据以kv类型显示,同时还会存在hbase的元数据信息,包括整个hfile文件的索引大小,描述,k和v的均匀长度,文件中包含的开始的key和结束的key,以及中位数key,等信息便于检索,以及布隆过滤器等信息,这个数据在我们hbase进行查询读取的时候按照64KB为一个大小进行读取内容数据,其中读取的元数据会全部加载,但是kv类型的真正存储数据会按照64KB为最小
Matrix707 天前
大数据·数据库·hbase
HBase理论_背景特点及数据单元及与Hive对比本文结合了个人的笔记以及工作中实践经验以及参考HBase官网,我尽可能把自己的知识点呈现出来,如果有误,还请指正。
Mephisto.java8 天前
大数据·hbase
【大数据学习 | HBASE高级】hive操作hbase一般在查询hbase的数据的时候我们可以直接使用hbase的命令行或者是api进行查询就行了,但是在日常的计算过程中我们一般都不是为了查询,都是在查询的基础上进行二次计算,所以使用hbase的命令是没有办法进行数据计算的,并且对于hbase的压力也会增加很多,hbase的本身并没有提供任何的计算逻辑,所以我们要依赖于mapreducer进行计算,这个代码上面我们已经实现过了,但是后续开发过程中很少有人会直接开发mr程序,这个代码的复杂程度比较高,并且会非常大的拖慢我们的开发速度,所以一般我们都会使用hiv
Mephisto.java9 天前
大数据·sql·mysql·json·hbase·database
【大数据学习 | HBASE高级】rowkey的设计,hbase的预分区和压缩RowKey可以是任意字符串,最大长度64KB,实际应用中一般为10~100bytes,字典顺序排序,rowkey的设计至关重要,会影响region分布,如果rowkey设计不合理还会出现region写热点等一系列问题。
Mephisto.java9 天前
大数据·学习·hbase
【大数据学习 | HBASE高级】hbase的API操作首先引入hbase的依赖将hbase-site.xml放入到resouces文件夹中整体代码如下:
三劫散仙9 天前
hive·hadoop·hbase·ranger
Hadoop + Hive + Apache Ranger 源码编译记录由于 CDH(Cloudera's Distribution Hadoop )近几年已经开始收费并限制节点数量和版本升级,最近使用开源的 hadoop 搭了一套测试集群,其中的权限管理组件用到了Apache Ranger,所以记录一下编译打包过程。
Mephisto.java9 天前
大数据·sql·oracle·json·hbase·database
【大数据学习 | HBASE高级】storeFile文件的合并Compaction 操作分成下面两种:Minor Compaction:是选取一些小的、相邻的StoreFile将他们合并成一个更大的StoreFile,对于删除、过期、多余版本的数据不进行清除。
这样の我9 天前
大数据·数据库·hbase
hbase集成phoenix环境准备官网下载地址,需挂梯子,使用官网推荐的对应hbase版本即可下载及解压修改 /etc/profile 环境变量
大数据魔法师9 天前
hadoop·分布式·hbase
Hadoop生态圈框架部署(六)- HBase完全分布式部署随着大数据技术的不断发展,HBase 作为 Hadoop 生态系统中的重要组件,因其出色的性能和可扩展性而受到广泛欢迎。本文将详细介绍 HBase 在完全分布式环境下的安装与配置过程。我们将从环境准备、软件下载、配置文件修改到集群启动等多个环节进行逐一讲解,确保读者能够顺利搭建起自己的 HBase 分布式集群。通过本文的学习,读者不仅能够掌握 HBase 的安装步骤,还能了解其核心配置项的意义和作用,为后续的数据存储与管理打下坚实的基础。