HBase 常用 shell 操作

下面给大家介绍一些HBase 常用 shell 操作,各位看官看好了啦,我要献丑了。

  1. 进入 HBase 客户端命令操作界面
powershell 复制代码
$ bin/hbase shell
  1. 查看帮助命令
powershell 复制代码
> help
  1. 查看当前数据库中有哪些表
powershell 复制代码
> list
  1. 创建一张表
    创建 user 表,包含 info、data 两个列族
powershell 复制代码
> create 'user', {NAME => 'info', VERSIONS => '3'},{NAME => 'data'}
  1. 添加数据操作
    向 user 表中插入信息,row key 为 rk0001,列族 info 中添加 name 列标示符,值为 zhangsan
powershell 复制代码
> put 'user', 'rk0001', 'info:name', 'zhangsan'
  1. 通过 rowkey 进行查询
powershell 复制代码
> get 'user', 'rk0001'
  1. 查看 rowkey 下面的某个列族的信息
powershell 复制代码
> get 'user', 'rk0001', 'info'
  1. 查看 rowkey 指定列族指定字段的值
powershell 复制代码
> get 'user', 'rk0001', 'info:name', 'info:age'
  1. 查看 rowkey 指定多个列族的信息
    获取 user 表中 row key 为 rk0001,info、data 列族的信息
powershell 复制代码
> get 'user', 'rk0001', 'info', 'data'
  1. 指定 rowkey 与列值查询
    获取 user 表中 row key 为 rk0001,cell 的值为 zhangsan 的信息
powershell 复制代码
> get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'binary:zhangsan')"}
  1. 指定 rowkey 与列值模糊查询
    获取 user 表中 row key 为 rk0001,列标示符中含有 a 的信息
powershell 复制代码
> get 'user', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"}
  1. 查询所有数据
    查询 user 表中的所有信息
powershell 复制代码
> scan 'user'
  1. 列族查询
    查询 user 表中列族为 info 的信息
powershell 复制代码
> scan 'user', {COLUMNS => 'info'}
  1. 多列族查询
    查询 user 表中列族为 info 和 data 的信息
powershell 复制代码
> scan 'user', {COLUMNS => ['info', 'data']}
  1. 指定列族与某个列名查询
    查询 user 表中列族为 info、列标示符为 name 的信息
powershell 复制代码
> scan 'user', {COLUMNS => 'info:name'}
  1. 指定列族与列名以及限定版本查询
    查询 user 表中列族为 info、列标示符为 name 的信息,并且版本最新的 5 个
powershell 复制代码
> scan 'user', {COLUMNS => 'info:name', VERSIONS => 5}
  1. 指定多个列族与按照数据值模糊查询
    查询 user 表中列族为 info 和 data 且列标示符中含有 a 字符的信息
powershell 复制代码
> scan 'user', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"}
  1. rowkey 的范围值查询
    查询 user 表中列族为 info,rk 范围是(rk0001, rk0003)的数据
powershell 复制代码
> scan 'user', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'}
  1. 指定 rowkey 模糊查询
    查询 user 表中 row key 以 rk 字符开头的
powershell 复制代码
> scan 'user',{FILTER=>"PrefixFilter('rk')"}
  1. 指定数据范围值查询
    查询 user 表中指定范围的数据
powershell 复制代码
> scan 'user', {TIMERANGE => [1392368783980, 1392380169184]}
  1. .统计一张表有多少行数据
powershell 复制代码
> count 'user'
  1. 更新版本号
    将 user 表的 f1 列族版本号改为 5
powershell 复制代码
> alter 'user', NAME => 'info', VERSIONS => 5
  1. 指定 rowkey 以及列名进行删除
    删除 user 表 row key 为 rk0001,列标示符为 info:name 的数据
powershell 复制代码
> delete 'user', 'rk0001', 'info:name'
  1. 指定 rowkey,列名以及字段值进行删除
    删除 user 表 row key 为 rk0001,列标示符为 info:name,timestamp 为
    1392383705316 的数据
powershell 复制代码
> delete 'user', 'rk0001', 'info:name', 1392383705316
  1. 删除一个列族
powershell 复制代码
> alter 'user', NAME => 'info', METHOD => 'delete'
  1. 清空表数据
powershell 复制代码
> truncate 'user'
  1. 删除表
    首先需要先让该表为 disable 状态,使用命令:
powershell 复制代码
> disable 'user

然后才能 drop 这个表,使用命令:

powershell 复制代码
> drop 'user' 
> 注意:如果直接 drop 表,会报错:Drop the named table. Table must first be disabled

得了,今天就学到这里吧。下班,溜溜球。

相关推荐
武子康2 小时前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
字节跳动数据平台1 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康1 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
字节跳动数据平台2 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术2 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
阿白的白日梦2 天前
winget基础管理---更新/修改源为国内源
windows
大大大大晴天2 天前
Flink生产问题排障-HBase NotServingRegionException
flink·hbase
武子康2 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康3 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天3 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink