HBase 常用 shell 操作

下面给大家介绍一些HBase 常用 shell 操作,各位看官看好了啦,我要献丑了。

  1. 进入 HBase 客户端命令操作界面
powershell 复制代码
$ bin/hbase shell
  1. 查看帮助命令
powershell 复制代码
> help
  1. 查看当前数据库中有哪些表
powershell 复制代码
> list
  1. 创建一张表
    创建 user 表,包含 info、data 两个列族
powershell 复制代码
> create 'user', {NAME => 'info', VERSIONS => '3'},{NAME => 'data'}
  1. 添加数据操作
    向 user 表中插入信息,row key 为 rk0001,列族 info 中添加 name 列标示符,值为 zhangsan
powershell 复制代码
> put 'user', 'rk0001', 'info:name', 'zhangsan'
  1. 通过 rowkey 进行查询
powershell 复制代码
> get 'user', 'rk0001'
  1. 查看 rowkey 下面的某个列族的信息
powershell 复制代码
> get 'user', 'rk0001', 'info'
  1. 查看 rowkey 指定列族指定字段的值
powershell 复制代码
> get 'user', 'rk0001', 'info:name', 'info:age'
  1. 查看 rowkey 指定多个列族的信息
    获取 user 表中 row key 为 rk0001,info、data 列族的信息
powershell 复制代码
> get 'user', 'rk0001', 'info', 'data'
  1. 指定 rowkey 与列值查询
    获取 user 表中 row key 为 rk0001,cell 的值为 zhangsan 的信息
powershell 复制代码
> get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'binary:zhangsan')"}
  1. 指定 rowkey 与列值模糊查询
    获取 user 表中 row key 为 rk0001,列标示符中含有 a 的信息
powershell 复制代码
> get 'user', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"}
  1. 查询所有数据
    查询 user 表中的所有信息
powershell 复制代码
> scan 'user'
  1. 列族查询
    查询 user 表中列族为 info 的信息
powershell 复制代码
> scan 'user', {COLUMNS => 'info'}
  1. 多列族查询
    查询 user 表中列族为 info 和 data 的信息
powershell 复制代码
> scan 'user', {COLUMNS => ['info', 'data']}
  1. 指定列族与某个列名查询
    查询 user 表中列族为 info、列标示符为 name 的信息
powershell 复制代码
> scan 'user', {COLUMNS => 'info:name'}
  1. 指定列族与列名以及限定版本查询
    查询 user 表中列族为 info、列标示符为 name 的信息,并且版本最新的 5 个
powershell 复制代码
> scan 'user', {COLUMNS => 'info:name', VERSIONS => 5}
  1. 指定多个列族与按照数据值模糊查询
    查询 user 表中列族为 info 和 data 且列标示符中含有 a 字符的信息
powershell 复制代码
> scan 'user', {COLUMNS => ['info', 'data'], FILTER => "(QualifierFilter(=,'substring:a'))"}
  1. rowkey 的范围值查询
    查询 user 表中列族为 info,rk 范围是(rk0001, rk0003)的数据
powershell 复制代码
> scan 'user', {COLUMNS => 'info', STARTROW => 'rk0001', ENDROW => 'rk0003'}
  1. 指定 rowkey 模糊查询
    查询 user 表中 row key 以 rk 字符开头的
powershell 复制代码
> scan 'user',{FILTER=>"PrefixFilter('rk')"}
  1. 指定数据范围值查询
    查询 user 表中指定范围的数据
powershell 复制代码
> scan 'user', {TIMERANGE => [1392368783980, 1392380169184]}
  1. .统计一张表有多少行数据
powershell 复制代码
> count 'user'
  1. 更新版本号
    将 user 表的 f1 列族版本号改为 5
powershell 复制代码
> alter 'user', NAME => 'info', VERSIONS => 5
  1. 指定 rowkey 以及列名进行删除
    删除 user 表 row key 为 rk0001,列标示符为 info:name 的数据
powershell 复制代码
> delete 'user', 'rk0001', 'info:name'
  1. 指定 rowkey,列名以及字段值进行删除
    删除 user 表 row key 为 rk0001,列标示符为 info:name,timestamp 为
    1392383705316 的数据
powershell 复制代码
> delete 'user', 'rk0001', 'info:name', 1392383705316
  1. 删除一个列族
powershell 复制代码
> alter 'user', NAME => 'info', METHOD => 'delete'
  1. 清空表数据
powershell 复制代码
> truncate 'user'
  1. 删除表
    首先需要先让该表为 disable 状态,使用命令:
powershell 复制代码
> disable 'user

然后才能 drop 这个表,使用命令:

powershell 复制代码
> drop 'user' 
> 注意:如果直接 drop 表,会报错:Drop the named table. Table must first be disabled

得了,今天就学到这里吧。下班,溜溜球。

相关推荐
金融小师妹2 小时前
应用BERT-GCN跨模态情绪分析:贸易缓和与金价波动的AI归因
大数据·人工智能·算法
武子康2 小时前
大语言模型 10 - 从0开始训练GPT 0.25B参数量 补充知识之模型架构 MoE、ReLU、FFN、MixFFN
大数据·人工智能·gpt·ai·语言模型·自然语言处理
网络空间小黑3 小时前
TCP/IP 知识体系
网络·网络协议·tcp/ip·计算机网络·5g·wireshark·信息与通信
Dotrust东信创智4 小时前
面向SDV的在环测试深度解析——仿真中间件SIL KIT应用篇
网络·中间件·汽车
leoufung5 小时前
ECPF 简介
linux·网络·kernel
睎zyl6 小时前
Spark自定义分区器-基础
大数据·分布式·spark
巨龙之路6 小时前
【TDengine源码阅读】DLL_EXPORT
大数据·时序数据库·tdengine
救救孩子把6 小时前
MCP本地高效与云端实时:stdio 与 HTTP+SSE 传输机制深度对比
网络·网络协议·http·sse·mcp·stdio
hao_wujing7 小时前
衡量 5G 和未来网络的安全性
网络·5g
元6337 小时前
搭建spark-local模式
大数据·spark