下面给大家介绍一些HBase 常用 shell 操作,各位看官看好了啦,我要献丑了。
- 进入 HBase 客户端命令操作界面
powershell
$ bin/hbase shell
- 查看帮助命令
powershell
> help
- 查看当前数据库中有哪些表
powershell
> list
- 创建一张表
创建 user 表,包含 info、data 两个列族
powershell
> create 'user', {NAME => 'info', VERSIONS => '3'},{NAME => 'data'}
- 添加数据操作
向 user 表中插入信息,row key 为 rk0001,列族 info 中添加 name 列标示符,值为 zhangsan
powershell
> put 'user', 'rk0001', 'info:name', 'zhangsan'
- 通过 rowkey 进行查询
powershell
> get 'user', 'rk0001'
- 查看 rowkey 下面的某个列族的信息
powershell
> get 'user', 'rk0001', 'info'
- 查看 rowkey 指定列族指定字段的值
powershell
> get 'user', 'rk0001', 'info:name', 'info:age'
- 查看 rowkey 指定多个列族的信息
获取 user 表中 row key 为 rk0001,info、data 列族的信息
powershell
> get 'user', 'rk0001', 'info', 'data'
- 指定 rowkey 与列值查询
获取 user 表中 row key 为 rk0001,cell 的值为 zhangsan 的信息
powershell
> get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'binary:zhangsan')"}
- 指定 rowkey 与列值模糊查询
获取 user 表中 row key 为 rk0001,列标示符中含有 a 的信息
powershell
> get 'user', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"}
- 查询所有数据
查询 user 表中的所有信息
powershell
> scan 'user'
- 列族查询
查询 user 表中列族为 info 的信息
powershell
> scan 'user', {COLUMNS => 'info'}
- 多列族查询
查询 user 表中列族为 info 和 data 的信息
powershell
> scan 'user', {COLUMNS => ['info', 'data']}
- 指定列族与某个列名查询
查询 user 表中列族为 info、列标示符为 name 的信息
powershell
> scan 'user', {COLUMNS => 'info:name'}
- 指定列族与列名以及限定版本查询
查询 user 表中列族为 info、列标示符为 name 的信息,并且版本最新的 5 个
powershell
> scan 'user', {COLUMNS => 'info:name', VERSIONS => 5}
- 指定多个列族与按照数据值模糊查询
查询 user 表中列族为 info 和 data 且列标示符中含有 a 字符的信息
powershell
> scan 'user', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"}
- rowkey 的范围值查询
查询 user 表中列族为 info,rk 范围是(rk0001, rk0003)的数据
powershell
> scan 'user', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'}
- 指定 rowkey 模糊查询
查询 user 表中 row key 以 rk 字符开头的
powershell
> scan 'user',{FILTER=>"PrefixFilter('rk')"}
- 指定数据范围值查询
查询 user 表中指定范围的数据
powershell
> scan 'user', {TIMERANGE => [1392368783980, 1392380169184]}
- .统计一张表有多少行数据
powershell
> count 'user'
- 更新版本号
将 user 表的 f1 列族版本号改为 5
powershell
> alter 'user', NAME => 'info', VERSIONS => 5
- 指定 rowkey 以及列名进行删除
删除 user 表 row key 为 rk0001,列标示符为 info:name 的数据
powershell
> delete 'user', 'rk0001', 'info:name'
- 指定 rowkey,列名以及字段值进行删除
删除 user 表 row key 为 rk0001,列标示符为 info:name,timestamp 为
1392383705316 的数据
powershell
> delete 'user', 'rk0001', 'info:name', 1392383705316
- 删除一个列族
powershell
> alter 'user', NAME => 'info', METHOD => 'delete'
- 清空表数据
powershell
> truncate 'user'
- 删除表
首先需要先让该表为 disable 状态,使用命令:
powershell
> disable 'user
然后才能 drop 这个表,使用命令:
powershell
> drop 'user'
> 注意:如果直接 drop 表,会报错:Drop the named table. Table must first be disabled
得了,今天就学到这里吧。下班,溜溜球。