技术栈
hbase
某zhuan
8 小时前
centos
·
云计算
·
hbase
云计算实验4——CentOS中HBase的安装
本文是对“云计算”课程学习中 HBase安装实验 的实验步骤记录。若有错误,欢迎交流指正。 实验环境:3台CentOS 7虚拟机,均已配置Java1.8、zookeeper、hadoop
直有两条腿
4 天前
大数据
·
数据库
·
hbase
【数据迁移】HBase Bulkload批量加载原理
在有大量数据需要写入到HBase当中时,通常有put和Bulkload两种方式。在put数据时会先将数据的更新操作信息和数据信息写入WAL,在写入到WAL后,数据就会被放到MemStore中,当MemStore满后数据就会被 flush 到磁盘(即形成HFile文件)。在这种写操作过程会涉及到 flush、split、compaction 等操作,容易造成节点不稳定、数据导入慢、耗费资源等问题。在海量数据的导入过程极大的消耗了系统性能。避免这些问题最好的方法就是使用 BulkLoad 的方式来加载数据到
BD_Marathon
4 天前
hbase
启动hbase后,hbmaster总是挂
使用df -h查看各个节点磁盘占用情况发现是磁盘空间不够导致使用如下命令搜索文件并删除不需要的文件删除hdfs上的hbase目录
洛克大航海
8 天前
大数据
·
linux
·
数据库
·
ubuntu
·
hbase
Ubuntu安装Hbase
本文主要介绍如何在虚拟机 Ubuntu 上安装 Hbase ,具体操作如下所示。Hbase 下载网址:https://hbase.apache.org/
智海观潮
12 天前
大数据
·
hadoop
·
hbase
HBase高级特性、rowkey设计以及热点问题处理
更多干货抢先看:大数据技术干货合集在阐述HBase高级特性和热点问题处理前,首先回顾一下HBase的特点:分布式、列存储、支持实时读写、存储的数据类型都是字节数组byte[],主要用来处理结构化和半结构化数据,底层数据存储基于hdfs。
武子康
14 天前
java
·
数据库
·
redis
·
mongodb
·
性能优化
·
nosql
·
hbase
Java-143 深入浅出 MongoDB NoSQL:MongoDB、Redis、HBase、Neo4j应用场景与对比
AI炼丹日志-31- 千呼万唤始出来 GPT-5 发布!“快的模型 + 深度思考模型 + 实时路由”,持续打造实用AI工具指南!📐🤖
风跟我说过她
15 天前
hive
·
hadoop
·
经验分享
·
centos
·
hbase
·
sqoop
Sqoop的安装与配置
使得环境生效查看版本信息sqoop versionmysql驱动程序 将mysql-connector-java-5.1.32-bin.jar放入sqoop的lib目录
我要用代码向我喜欢的女孩表白
23 天前
大数据
·
数据库
·
hbase
HBase全量+增量迁移import/export方式
本文是用自带的hbase import/export方法,由于原端不开放hdfs数据,并且因为底层存储不能打快照,目标端也不开放,所以只能通过这种方式。(这种方式比较耗性能)
Dobby_05
1 个月前
大数据
·
hadoop
·
分布式
·
hbase
【Hadoop】HBase:构建于HDFS之上的分布式列式NoSQL数据库
本专栏文章持续更新,新增内容使用蓝色表示。在大数据时代,传统关系型数据库面临海量数据存储和高并发访问的挑战。HBase作为Apache Hadoop生态系统中的重要组成部分,提供了一个分布式、可扩展的列式存储解决方案。
isfox
1 个月前
hbase
Google Bigtable深度解析:分布式存储的设计典范
Google Bigtable 作为分布式结构化数据存储的里程碑技术,其设计理念深刻影响了 HBase、Cassandra 等开源分布式数据库。Bigtable 以高扩展性、高可用性和灵活的数据模型为核心,通过双层架构(GFS 持久化 + 分布式索引)支撑 PB 级数据存储与高效访问。本文将从数据模型、系统架构、核心组件及技术特点等方面全面解析 Bigtable,揭示其成为分布式存储标杆的底层逻辑。
青云交
1 个月前
java
·
hdfs
·
flink
·
智慧城市
·
hbase
·
java 分布式存储
·
时空大数据
Java 大视界 -- 基于 Java 的大数据分布式存储在智慧城市时空大数据管理与应用中的创新实践(408)
亲爱的 Java 和 大数据爱好者们,大家好!我是CSDN(全区域)四榜榜首青云交!去年深秋在某新一线城市(2023 年 GDP 1.2 万亿)的智慧交通指挥中心,运维组长老李攥着鼠标垫跟我急得直跺脚:“早高峰 7 点到 9 点,2000 个路口的摄像头每秒钟往服务器灌 300MB 轨迹数据,单机存储撑了 3 天就报‘磁盘满’!更要命的是,交警查昨天早高峰的拥堵溯源,查 1 条浙 A 车牌的轨迹要等 5 秒,指挥中心的电话都被打爆了!”
小白不想白a
2 个月前
hadoop
·
分布式
·
zookeeper
·
hbase
·
sqoop
【Hadoop】Zookeeper、HBase、Sqoop
Zookeeper可以监视HDFS系统的name node和data node,HBase也极度依赖zookeeper,因为zookeeper维护了HBase的源数据以及监控所有region server的健康状态,如果region server宕机会通知master 。它也可以避免脑裂(只有一个master大脑)。啊不免,通过分布式锁实现数据的一致性,YARN资源管理也依赖zookeeper,它为YARNresource manager提供节点选举服务。他还管理进入的消息队列。
蝎子莱莱爱打怪
2 个月前
大数据
·
后端
·
hbase
Hadoop3.3.5、Hbase2.6.1 集群搭建&Phoenix使用记录
当前我的im聊天系统的消息是存到mysql里的,虽然我做了分库分表: 但是本质上这么做是很low的,也并不能满足百万并发的设计目标。so 、调研了半天,我准备使用hbase 做消息存储,本文不介绍hbase是啥,只是单纯记录hadoop、hbase的安装过程。以作备忘。
君不见,青丝成雪
2 个月前
大数据
·
hadoop
·
hbase
hadoop技术栈(九)Hbase替代方案
云原生托管NoSQL服务:开源NewSQL/分布式SQL数据库:高性能时序数据库:其他宽列存储数据库:
lifallen
2 个月前
大数据
·
数据库
·
分布式
·
算法
·
性能优化
·
apache
·
hbase
HBase的异步WAL性能优化:RingBuffer的奥秘
在 HBase 中,预写日志(Write-Ahead Log, WAL)是保证数据持久性和一致性的核心组件。每一次数据写入(Put/Delete)都必须先成功写入 WAL,然后才能更新内存中的 MemStore。这个特性决定了 WAL 的写入性能直接关系到整个 HBase 集群的写入吞吐量和延迟,因此对其性能优化至关重要。
小戈爱学习
3 个月前
hive
·
hadoop
·
hbase
CDP集群中通过Hive外部表迁移HBase数据的操作记录
在CDP(Cloudera Data Platform)集群中,通过创建Hive外部表映射HBase表,实现HBase表数据的查询与迁移,验证该方式的可行性与数据一致性。
大数据狂人
3 个月前
hive
·
mysql
·
hbase
从 Hive 数仓出发,全面剖析 StarRocks、MySQL、HBase 的使用场景与区别
在现代大数据架构中,Hive 通常作为离线数仓的核心底座,负责批量数据的接入、清洗、计算与存储。然而,为了满足 实时计算、低延迟查询、业务交互型操作和高并发存储 等不同需求,我们往往需要结合使用 StarRocks、MySQL 和 HBase 等组件。
让头发掉下来
3 个月前
大数据
·
hive
·
hadoop
·
hbase
·
sqoop
Sqoop详细学习文档
Sqoop(发音:skup)是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。
Fireworkitte
3 个月前
redis
·
mongodb
·
hbase
HBase、MongoDB 和 Redis 的区别详解
这三者都是流行的 NoSQL 数据库,但设计目标、数据模型和适用场景有显著差异。以下是它们的核心对比:
码字的字节
3 个月前
hadoop
·
hbase
·
wal
·
mvcc
深入解析HBase如何保证强一致性:WAL日志与MVCC机制
在分布式数据库系统中,强一致性是确保数据可靠性和系统可信度的核心支柱。作为Hadoop生态系统中关键的列式存储数据库,HBase需要处理金融交易、实时风控等高敏感场景下的海量数据操作,这使得强一致性成为其设计架构中不可妥协的基础特性。