【大数据运维】Hbase shell 常见操作

文章目录

  • [一. DDL](#一. DDL)
    • [1. 表的DDL](#1. 表的DDL)
      • [1.1. 创建表](#1.1. 创建表)
      • [1.2. 删除表](#1.2. 删除表)
    • [2. 列族的DDL](#2. 列族的DDL)
      • [2.1. 增加一个列簇](#2.1. 增加一个列簇)
      • [2.2. 删除列族](#2.2. 删除列族)
      • [2.3. 修改列族版本(ing)](#2.3. 修改列族版本(ing))
  • [二. DML](#二. DML)
    • [1. 插入与更新数据](#1. 插入与更新数据)
    • [2. 删除数据](#2. 删除数据)
    • [3. 清空表](#3. 清空表)
  • [三. DQL](#三. DQL)
    • [1. scan:查一批数据](#1. scan:查一批数据)
      • [1.1. 查询全部](#1.1. 查询全部)
      • [1.2. 过滤rowkey](#1.2. 过滤rowkey)
      • [1.3. 过滤列](#1.3. 过滤列)
      • [1.4. 列族查询](#1.4. 列族查询)
    • [2. get:查询一条](#2. get:查询一条)
      • [1.1. 指定rowkey](#1.1. 指定rowkey)
      • [1.2. 过滤值](#1.2. 过滤值)
      • [1.3. 过滤列](#1.3. 过滤列)

先进入到shell中 ./bin/hbase shell

sql 复制代码
-- 查看Hbase服务器状态
status


-- 查看当前数据库中有哪些表
list


-- 列出一些表的详细信息
describe 'book'

一. DDL

1. 表的DDL

1.1. 创建表

sql 复制代码
创建student表, 包含base_f1、base_f2两个列族

create 'student', 'base_f1', 'base_f2' 
或者 
create 'user', {NAME => 'base_f1', VERSIONS => '1'},{NAME => 'base_f2'}

1.2. 删除表

sql 复制代码
-- 先disable 再drop hbase
disable 'student' 
drop 'student' 

-- 如果不进行disable,直接drop会报错 ERROR: Table student is enabled. Disable it first.

2. 列族的DDL

2.1. 增加一个列簇

sql 复制代码
alter 'book','date'

2.2. 删除列族

sql 复制代码
alter 'student', 'delete' => 'base_f1'

2.3. 修改列族版本(ing)

sql 复制代码
alter 'book',{NAME=>'date',VERSIONS=>3}}

二. DML

1. 插入与更新数据

sql 复制代码
-- put '表名称', 'rowkey', '列族:列名', '值'
-- 因为表中只定义了列族,所以列族下的新列可以直接在插入数据下添加
-- 向表中添加数据,在想HBase的表中添加数据的时候,只能一列一列的添加,不能同时添加多列。

put 'staff1','0101','info2:nnn1','test'

更新操作同插入操作一模一样,只不过有数据就更新(实际是加了一个版本),没数据就添加

更新版本号

sql 复制代码
-- 将student表的 base_info 列族版本号改为5

alter 'student', NAME => 'base_f1', VERSIONS => 5

2. 删除数据

sql 复制代码
-- 删除student表 rowkey为rk01,列标示符为 base_f1:name 的数据

delete 'student', 'rk01', 'base_f1:name'


-- 指定时间戳删除
delete 'student', 'rk01', 'base_f1:name', 1392383705316

3. 清空表

sql 复制代码
truncate 'book'

三. DQL

1. scan:查一批数据

1.1. 查询全部

sql 复制代码
scan 'staff1'

ROW                         COLUMN+CELL
 0101                       column=info1:sea, timestamp=1711098585861, value=test
 0102                       column=info2:addr, timestamp=1711098585993, value=test1
 0102                       column=info2:name, timestamp=1711098585923, value=test1
 0102                       column=info2:sea1, timestamp=1711098585895, value=test1  


-- 过滤查询
scan 'book',{LIMIT=>2}


-- 包含STARTROW,不包含ENDROW
scan 'book',{STARTROW=>'1',ENDROW=>'3'}

1.2. 过滤rowkey

sql 复制代码
-- 查询student表中row key以rk字符开头的

scan 'student',{FILTER=>"PrefixFilter('rk')"}

1.3. 过滤列

sql 复制代码
-- 查询student表中列族为 base_f1 和 base_f2且列标示符中含有aa字符的信息

scan 'student', {COLUMNS => ['base_f1 ', 'base_f2'], FILTER => "(QualifierFilter(=,'substring:aa'))"}

1.4. 列族查询

sql 复制代码
-- 列族
scan 'student', {COLUMNS => ['base_f1', 'base_f2']} 

--列族:列
scan 'student', {COLUMNS => ['base_f1:name', 'base_f2:address']}


-- 列族:列 并指定最新的三个版本
scan 'student', {COLUMNS => 'base_f1:name', VERSIONS => 3}

2. get:查询一条

1.1. 指定rowkey

sql 复制代码
--获取student表中row key为rk01的所有信息
get 'student', 'rk01'


-- 获取user表中row key为rk0001,base_info列族的所有信息
get 'student', 'rk01', 'base_f1'


-- 获取student表中row key为rk0001,base_info列族的name、age列标示符的信息
get 'student', 'rk01', 'base_f1:name', 'base_f2:address'

1.2. 过滤值

sql 复制代码
-- 获取student表中row key为rk01,值为zhangsan的信息

get 'student', 'rk01', {FILTER => "ValueFilter(=, 'name:zhangsan')"}

1.3. 过滤列

sql 复制代码
-- 获取student表中row key为rk01,列中含有a的信息
get 'student', 'rk01', {FILTER => (QualifierFilter(=,'substring:a'))"}
相关推荐
逸模5 小时前
告别熬夜手工整理台账,逸模智能归集实现项目数据自动化存档
大数据·运维·人工智能·笔记·其他·信息可视化·自动化
sbjdhjd5 小时前
Redis 主从复制、哨兵高可用与 Cluster 集群部署实验手册
运维·前端·redis·云原生·开源·bootstrap·html
AOwhisky6 小时前
MySQL 学习笔记(第四期):SQL 语言之多表查询
linux·运维·网络·数据库·笔记·学习·mysql
Phantom Void6 小时前
服务器处理客户端请求的设计方法
linux·运维·网络
倔强的石头1066 小时前
Fooocus开源神器+cpolarAI让绘画告别服务器依赖
运维·服务器·cpolar
wei_shuo6 小时前
服务器挂了等用户投诉才发现?我用Beszel搭了轻量监控系统,宕机第一时间通知我
运维·服务器
王码码20356 小时前
多台服务器怎么统一看状态?Beszel 轻量监控,搭起来不费事
运维·服务器·后端·安全·阿里云·接口·web
audyxiao0017 小时前
ICLR 2026论文分享 | WorldGym:用世界模型打造机器人策略评估新范式
大数据·人工智能·大模型·智能体·世界模型
Rubin智造社8 小时前
Anthropic安全白皮书2|三级成熟度模型:你的AI智能体该配哪级安全?
大数据·安全·沙箱隔离·零信任成熟度模型·三级安全框架·jit权限·不可变审计
ACP广源盛139246256738 小时前
GSV2221 显示转换芯片@ACP#赋能 RTX Spark 端侧 AI 设备,构建多屏全模态视觉交互新生态
大数据·人工智能·嵌入式硬件·gpt·spark·电脑·音视频