Hive csv文件导入Hive

一、如何把csv文件导入Hive

(1) 在Hive中建立与csv相对应的表

sql 复制代码
create table if not exists tmp.tmp_wenxin_20231123
(
  redeem_code_id   string  comment  ''
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;

创建了一张名为tmp_wenxin_20231123的hive表,表中只有一个列redeem_code_id;这个表以逗号作为分隔符,并以文本文件的形式存储。

(2) 将csv文件上传到Hdfs

powershell 复制代码
hdfs dfs -put /home/sysadmin/tmp/20231123.csv /tmp

(3) 将hdfs文件上load到Hive

sql 复制代码
load data inpath '/tmp/20231123.csv' into table tmp.tmp_wenxin_20231123;
相关推荐
Leo.yuan20 小时前
数据清洗(ETL/ELT)原理与工具选择指南:企业数字化转型的核心引擎
大数据·数据仓库·数据挖掘·数据分析·etl
isNotNullX1 天前
实时数仓和离线数仓还分不清楚?看完就懂了
大数据·数据库·数据仓库·人工智能·数据分析
熊猫钓鱼>_>1 天前
Hadoop 用户入门指南:驾驭大数据的力量
大数据·hadoop·分布式
William一直在路上1 天前
SpringBoot 拦截器和过滤器的区别
hive·spring boot·后端
Leo.yuan1 天前
数据分析师如何构建自己的底层逻辑?
大数据·数据仓库·人工智能·数据挖掘·数据分析
抛砖者1 天前
hive/spark sql中unix_timestamp 函数的坑以及时间戳相关的转换
hive·sql·spark
落霞的思绪1 天前
使用云虚拟机搭建hadoop集群环境
大数据·hadoop·分布式
无级程序员2 天前
大数据平台之ranger与ldap集成,同步用户和组
大数据·hadoop
梦想画家2 天前
数据仓库:企业数据管理的核心枢纽
数据仓库
梦想画家4 天前
数据仓库中的代理键:概念、应用与实践指南
数据仓库·代理键·缓慢维度变化