HBase 常用 shell 操作

下面给大家介绍一些HBase 常用 shell 操作，各位看官看好了啦，我要献丑了。

进入 HBase 客户端命令操作界面

powershell 复制代码

$ bin/hbase shell

查看帮助命令

powershell 复制代码

> help

查看当前数据库中有哪些表

powershell 复制代码

> list

创建一张表
创建 user 表，包含 info、data 两个列族

powershell 复制代码

> create 'user', {NAME => 'info', VERSIONS => '3'}，{NAME => 'data'}

添加数据操作
向 user 表中插入信息，row key 为 rk0001，列族 info 中添加 name 列标示符，值为 zhangsan

powershell 复制代码

> put 'user', 'rk0001', 'info:name', 'zhangsan'

通过 rowkey 进行查询

powershell 复制代码

> get 'user', 'rk0001'

查看 rowkey 下面的某个列族的信息

powershell 复制代码

> get 'user', 'rk0001', 'info'

查看 rowkey 指定列族指定字段的值

powershell 复制代码

> get 'user', 'rk0001', 'info:name', 'info:age'

查看 rowkey 指定多个列族的信息
获取 user 表中 row key 为 rk0001，info、data 列族的信息

powershell 复制代码

> get 'user', 'rk0001', 'info', 'data'

指定 rowkey 与列值查询
获取 user 表中 row key 为 rk0001，cell 的值为 zhangsan 的信息

powershell 复制代码

> get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'binary:zhangsan')"}

指定 rowkey 与列值模糊查询
获取 user 表中 row key 为 rk0001，列标示符中含有 a 的信息

powershell 复制代码

> get 'user', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"}

查询所有数据
查询 user 表中的所有信息

powershell 复制代码

> scan 'user'

列族查询
查询 user 表中列族为 info 的信息

powershell 复制代码

> scan 'user', {COLUMNS => 'info'}

多列族查询
查询 user 表中列族为 info 和 data 的信息

powershell 复制代码

> scan 'user', {COLUMNS => ['info', 'data']}

指定列族与某个列名查询
查询 user 表中列族为 info、列标示符为 name 的信息

powershell 复制代码

> scan 'user', {COLUMNS => 'info:name'}

指定列族与列名以及限定版本查询
查询 user 表中列族为 info、列标示符为 name 的信息,并且版本最新的 5 个

powershell 复制代码

> scan 'user', {COLUMNS => 'info:name', VERSIONS => 5}

指定多个列族与按照数据值模糊查询
查询 user 表中列族为 info 和 data 且列标示符中含有 a 字符的信息

powershell 复制代码

> scan 'user', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"}

rowkey 的范围值查询
查询 user 表中列族为 info，rk 范围是(rk0001, rk0003)的数据

powershell 复制代码

> scan 'user', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'}

指定 rowkey 模糊查询
查询 user 表中 row key 以 rk 字符开头的

powershell 复制代码

> scan 'user',{FILTER=>"PrefixFilter('rk')"}

指定数据范围值查询
查询 user 表中指定范围的数据

powershell 复制代码

> scan 'user', {TIMERANGE => [1392368783980, 1392380169184]}

.统计一张表有多少行数据

powershell 复制代码

> count 'user'

更新版本号
将 user 表的 f1 列族版本号改为 5

powershell 复制代码

> alter 'user', NAME => 'info', VERSIONS => 5

指定 rowkey 以及列名进行删除
删除 user 表 row key 为 rk0001，列标示符为 info:name 的数据

powershell 复制代码

> delete 'user', 'rk0001', 'info:name'

指定 rowkey，列名以及字段值进行删除
删除 user 表 row key 为 rk0001，列标示符为 info:name，timestamp 为
1392383705316 的数据

powershell 复制代码

> delete 'user', 'rk0001', 'info:name', 1392383705316

删除一个列族

powershell 复制代码

> alter 'user', NAME => 'info', METHOD => 'delete'

清空表数据

powershell 复制代码

> truncate 'user'

删除表
首先需要先让该表为 disable 状态，使用命令：

powershell 复制代码

> disable 'user

然后才能 drop 这个表，使用命令：

powershell 复制代码

> drop 'user' 
> 注意：如果直接 drop 表，会报错：Drop the named table. Table must first be disabled

得了，今天就学到这里吧。下班，溜溜球。