【HBase分布式数据库】第七章 数据的导入导出 importtsv导入数据

第七章 数据的导入导出

7.1 importtsv导入数据

任务目的

掌握导入tsv数据的方法

掌握导入csv数据的方法

任务清单

任务1:导入tsv数据

任务2:导入csv数据

任务步骤

任务1:导入tsv数据

1、创建测试表

进入hbase的shell环境,创建测试命名空间ns和测试表table_tsv。

shell 复制代码
bin/hbase shell
create_namespace 'ns'
create 'ns:table_tsv','info','more'

8.1-1

2、查看准备的测试数据

在hbase主目录下的testdata目录下,已备好了测试数据,了解该数据。

shell 复制代码
cat testdata/tsvdata.txt

8.1-2

3、上传数据到HDFS

HDFS上创建目录,把测试数据上传到该目录并查看。

shell 复制代码
hadoop fs -mkdir -p /data/input
hadoop fs -put testdata/tsvdata.txt /data/input
hadoop fs -cat /data/input/tsvdata.txt

8.1-3

4、查看如何导入

通过如下指令查看导入的帮助说明。

shell 复制代码
hadoop jar $HBASE_HOME/lib/hbase-server-1.4.10.jar

8.1-4

5、继续查看

选择importtsv ,继续查看下一步。

shell 复制代码
hadoop jar $HBASE_HOME/lib/hbase-server-1.4.10.jar importtsv

8.1-5

6、书写语句

按照格式书写语句。Dimporttsv.columns=rowkey,列族:列名,列族:列名... 分别对应输入数据按照 \t 分割的数据。并等待MR执行完毕。

shell 复制代码
hadoop jar $HBASE_HOME/lib/hbase-server-1.4.10.jar importtsv  
-Dimporttsv.columns=HBASE_ROW_KEY,info:name,more:location,more:age 
            ns:table_tsv /data/input/tsvdata.txt

7、查看数据

重新进入shell环境,查看数据。

shell 复制代码
bin/hbase shell
scan 'ns:table_tsv'

8.1-6

任务2:导入csv数据

1、创建测试表

创建测试表table_csv。

shell 复制代码
create 'ns:table_csv','info','more'

8.1-7

2、查看准备的测试数据

shell 复制代码
cat testdata/csvdata.txt

8.1-8

3、上传数据到HDFS

shell 复制代码
hadoop fs -put testdata/csvdata.txt /data/input

8.1-9

4、导入数据

使用importtsv导入数据。此处需要添加分隔符的语法。

shell 复制代码
hadoop jar $HBASE_HOME/lib/hbase-server-1.4.10.jar importtsv 
-Dimporttsv.separator=',' 
-Dimporttsv.columns=HBASE_ROW_KEY,info:name,more:location,more:age 
            ns:table_csv /data/input/csvdata.txt

5、查看数据

进入shell环境,查看数据。

shell 复制代码
scan 'ns:table_csv'

8.1-10

相关推荐
.Shu.32 分钟前
Mysql InnoDB 底层架构设计、功能、原理、源码系列合集【四、事务引擎核心 - MVCC与锁机制】
数据库·mysql
多工坊38 分钟前
【DataGrip】连接达梦数据库后,能查询数据但是看不到表的几种情况分析,达梦数据库驱动包下载DmJdbcDriver18.jar
java·数据库·jar
何中应1 小时前
如何用Redis作为消息队列
数据库·redis·缓存
liulilittle2 小时前
.NET反射与IL反编译核心技术
开发语言·数据库·c#·.net·反射·反编译·il
老纪的技术唠嗑局2 小时前
向量数据库在 UGC 社区个性化推荐的落地指南
数据库
张鱼小丸子2 小时前
MySQL企业级部署与高可用实战
运维·数据库·mysql·云原生·高可用·mha·组从复制
GalaxyPokemon2 小时前
MYSQL的默认隔离级别都有什么
数据库·mysql
DONG9132 小时前
《三驾马车:MySQL、MongoDB、Redis对比与融合实战》
数据库·redis·sql·mysql·mongodb·database
程序边界3 小时前
从 Oracle 到 KingbaseES:企业信创改造的“抄作业”模板,直接套用!
数据库·oracle
funfan05173 小时前
奇怪的“bug”--数据库的“隐式转换”行为
数据库·bug