引言
本文将论述如何将Windows本地的excel表数据,导入到虚拟机Linux系统中的Hadoop生态中的Hive数据仓库中。
实验准备
DBeaver
Hive3.1(Hadoop3.1)
excel数据表
实验步骤
一、首先打开虚拟机,启动Hadoop,启动hive,启动hiveserver2,连接DBeaver,成功连接展示如下:
data:image/s3,"s3://crabby-images/77897/77897a13d02af31e4f2c23f1a536cda9e42510c8" alt=""
二、将清洗后的excel表的数据另存为txt格式,并将文本转换为UTF-8:
首先点击文件:
data:image/s3,"s3://crabby-images/c1b92/c1b92512d8079bf1e2b982341559b561c7c901f6" alt=""
点击另存为,转换保存格式为txt,同时在工具中的Web选项中选择编码UTF-8:
data:image/s3,"s3://crabby-images/65915/659155dce3b8e6497bb84e80dfe7b98f7fc68715" alt=""
data:image/s3,"s3://crabby-images/4f6e2/4f6e2cda3711723c4844f66209b2771f348c4895" alt=""
data:image/s3,"s3://crabby-images/fca0b/fca0b4668c1fb7277f93e37bd60231708194e0df" alt=""
三、源excel表数据文件成功转换为test.txt文本文件,并删除第一行的字段(建表时已经建立英文名称字段了)截图如下:
data:image/s3,"s3://crabby-images/41659/416597dd3a4315817b642b6c185092227650978d" alt=""
四、将test.txt文件上传至虚拟机的Linux环境中,同时在hive里新建Test数据表(已经建库),输入建表语句的时候务必注意对应字段的类型必须相同。
data:image/s3,"s3://crabby-images/d9e97/d9e97fc4a6d9aa73299f93629074b51a5d288d83" alt=""
建立test数据表的语句如下(后面row...部分是以\t为分隔符,必须加上,否则会将整个数据全放在第一列中):
create table test(Name String,Age String,ID String) row format delimited fields terminated by '\t' STORED AS TEXTFILE;
成功建表如下截图如下:
data:image/s3,"s3://crabby-images/3346a/3346aac299fdf96b31edcf243ef76a50501b8678" alt=""
在DBeaver中查看截图如下:
data:image/s3,"s3://crabby-images/1342c/1342cbc22ad3e025f830c22dfca58aac3b59c495" alt=""
五、接着输入HQL语句:
load data local inpath '/test.txt' into table test;
成功上传test.txt的文件截图如下:
data:image/s3,"s3://crabby-images/787b6/787b62e5c9710490400a93914fe0aabb455c4230" alt=""
在DBeaver中查看截图如下:
data:image/s3,"s3://crabby-images/ae414/ae414ec908d6cbff7c9389ff86861b74994ef0c6" alt=""
也可以在hive中输入HQL语句查看
select * from test;
截图如下:
data:image/s3,"s3://crabby-images/fb4c6/fb4c63617dcb135d6fce0c8211ee958344956058" alt=""
至此,完成excel表数据传入Hive的所有操作。