EXCEL数据导入HIVE

引言

本文将论述如何将Windows本地的excel表数据,导入到虚拟机Linux系统中的Hadoop生态中的Hive数据仓库中。

实验准备

DBeaver

Hive3.1(Hadoop3.1)

excel数据表

实验步骤

一、首先打开虚拟机,启动Hadoop,启动hive,启动hiveserver2,连接DBeaver,成功连接展示如下:

二、将清洗后的excel表的数据另存为txt格式,并将文本转换为UTF-8:

首先点击文件:

点击另存为,转换保存格式为txt,同时在工具中的Web选项中选择编码UTF-8:

三、源excel表数据文件成功转换为test.txt文本文件,并删除第一行的字段(建表时已经建立英文名称字段了)截图如下:

四、将test.txt文件上传至虚拟机的Linux环境中,同时在hive里新建Test数据表(已经建库),输入建表语句的时候务必注意对应字段的类型必须相同。

建立test数据表的语句如下(后面row...部分是以\t为分隔符,必须加上,否则会将整个数据全放在第一列中):

复制代码
create table test(Name String,Age String,ID String) row format delimited fields terminated by '\t' STORED AS TEXTFILE;

成功建表如下截图如下:

在DBeaver中查看截图如下:

五、接着输入HQL语句:

复制代码
load data local inpath '/test.txt' into table test;

成功上传test.txt的文件截图如下:

在DBeaver中查看截图如下:

也可以在hive中输入HQL语句查看

复制代码
select * from test;

截图如下:

至此,完成excel表数据传入Hive的所有操作。

相关推荐
欧阳方超15 分钟前
Spark(1):不依赖Hadoop搭建Spark环境
大数据·hadoop·spark
Dobby_0515 小时前
【Hadoop】分布式文件系统 HDFS
大数据·hadoop·分布式
项目題供诗15 小时前
Hadoop(十一)
大数据·hadoop·分布式
学习中的阿陈20 小时前
Hadoop伪分布式环境配置
大数据·hadoop·分布式
vxtkjzxt8881 天前
手机群控平台的核心功能
数据库·数据仓库
IT研究室1 天前
大数据毕业设计选题推荐-基于大数据的健康与生活方式数据可视化分析系统-Spark-Hadoop-Bigdata
大数据·hadoop·spark·毕业设计·源码·数据可视化·bigdata
IT学长编程1 天前
计算机毕业设计 基于大数据技术的医疗数据分析与研究 Python 大数据毕业设计 Hadoop毕业设计选题【附源码+文档报告+安装调试】
大数据·hadoop·机器学习·数据分析·毕业设计·毕业论文·医疗数据分析
IT学长编程2 天前
计算机毕业设计 基于深度学习的酒店评论文本情感分析研究 Python毕业设计项目 Hadoop毕业设计选题 机器学习选题【附源码+文档报告+安装调试】
hadoop·python·深度学习·机器学习·数据分析·毕业设计·酒店评论文本情感分析
小朋友,你是否有很多问号?2 天前
Mac安装hadoop
hadoop·macos
奋斗的蛋黄2 天前
HDFS与Yarn深入剖析
大数据·运维·hadoop