Hive csv文件导入Hive

一、如何把csv文件导入Hive

(1) 在Hive中建立与csv相对应的表

sql 复制代码
create table if not exists tmp.tmp_wenxin_20231123
(
  redeem_code_id   string  comment  ''
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;

创建了一张名为tmp_wenxin_20231123的hive表,表中只有一个列redeem_code_id;这个表以逗号作为分隔符,并以文本文件的形式存储。

(2) 将csv文件上传到Hdfs

powershell 复制代码
hdfs dfs -put /home/sysadmin/tmp/20231123.csv /tmp

(3) 将hdfs文件上load到Hive

sql 复制代码
load data inpath '/tmp/20231123.csv' into table tmp.tmp_wenxin_20231123;
相关推荐
修先生6 小时前
Hive Udf函数AES加密
hive·aes·udf
SeaTunnel11 小时前
Apache SeaTunnel 4 月有何新动作?连接器增强与 Zeta 稳定性提升等亮点速览
大数据·数据仓库·spark·apache·seatunnel
Volunteer Technology11 小时前
HDFS源码(二)
大数据·hadoop·hdfs
承渊政道12 小时前
Oracle迁移避坑:一个(+)写错,LEFT JOIN可能变INNER JOIN
运维·服务器·数据库·数据仓库·学习·安全·oracle
WL_Aurora12 小时前
MapReduce框架原理深度解析 | Shuffle机制、切片分区、Join全攻略
大数据·hadoop·mapreduce
赵渝强老师12 小时前
【赵渝强老师】Hadoop的伪分布部署模式
大数据·hadoop·分布式
Volunteer Technology12 小时前
HDFS源码(一)
大数据·hadoop·hdfs
AllData公司负责人1 天前
通过Postgresql同步到Doris,全视角演示AllData数据中台核心功能效果,涵盖:数据入湖仓,数据同步,数据处理,数据服务,BI可视化驾驶舱
java·大数据·数据库·数据仓库·人工智能·python·postgresql
WL_Aurora1 天前
HDFS底层原理深度解析 | 读写流程、NameNode工作机制、DataNode心跳与数据完整性
大数据·hadoop·hdfs
Pushkin.1 天前
新数仓建设方法论与实践指南-分层解耦驱动的数据仓库
大数据·数据仓库