Hive csv文件导入Hive

一、如何把csv文件导入Hive

(1) 在Hive中建立与csv相对应的表

sql 复制代码
create table if not exists tmp.tmp_wenxin_20231123
(
  redeem_code_id   string  comment  ''
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;

创建了一张名为tmp_wenxin_20231123的hive表,表中只有一个列redeem_code_id;这个表以逗号作为分隔符,并以文本文件的形式存储。

(2) 将csv文件上传到Hdfs

powershell 复制代码
hdfs dfs -put /home/sysadmin/tmp/20231123.csv /tmp

(3) 将hdfs文件上load到Hive

sql 复制代码
load data inpath '/tmp/20231123.csv' into table tmp.tmp_wenxin_20231123;
相关推荐
makabalala7 小时前
如何利用YashanDB进行数据仓库构建
数据仓库
禅与计算机程序设计艺术8 小时前
了解NoSQL的数据仓库和ETL
数据库·数据仓库·nosql·etl
好学且牛逼的马14 小时前
从“配置地狱“到“云原生时代“:Spring Boot 1.x到4.x演进全记录与核心知识点详解
hive·spring boot·云原生
派可数据BI可视化1 天前
一文读懂系列:数据仓库为什么分层,分几层?数仓建模方法有哪些
大数据·数据仓库·信息可视化·spark·商业智能bi
Light601 天前
不止于名:领码 SPARK 如何“链”动数据仓库、数据湖、中台与湖仓一体新纪元
大数据·数据仓库·数据湖·ipaas·湖仓一体·数据中台·领码 spark
郑小憨1 天前
FlinkSQL窗口函数TUMBLE、SESSION 和 HOP的区别
大数据·数据仓库·sql·flink·database
码字的字节1 天前
锚点模型:数据仓库中的高度可扩展建模技术详解
大数据·数据仓库·spark
Agentic AI人工智能与大数据1 天前
大数据领域数据仓库的ETL任务优化
大数据·数据仓库·ai·etl
AI架构全栈开发实战笔记1 天前
AI应用架构师教你:如何用AI自动化数据仓库的测试?
数据仓库·人工智能·ai·自动化