Hive csv文件导入Hive

一、如何把csv文件导入Hive

(1) 在Hive中建立与csv相对应的表

sql 复制代码
create table if not exists tmp.tmp_wenxin_20231123
(
  redeem_code_id   string  comment  ''
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;

创建了一张名为tmp_wenxin_20231123的hive表,表中只有一个列redeem_code_id;这个表以逗号作为分隔符,并以文本文件的形式存储。

(2) 将csv文件上传到Hdfs

powershell 复制代码
hdfs dfs -put /home/sysadmin/tmp/20231123.csv /tmp

(3) 将hdfs文件上load到Hive

sql 复制代码
load data inpath '/tmp/20231123.csv' into table tmp.tmp_wenxin_20231123;
相关推荐
chad__chang12 小时前
dolphinscheduler安装过程
hive·hadoop
莫叫石榴姐18 小时前
字节数开一面
大数据·数据仓库·职场和发展
ajax_beijing1 天前
hadoop的三副本数据冗余策略
大数据·hadoop·分布式
weixin_307779131 天前
在 Microsoft Azure 上部署 ClickHouse 数据仓库:托管服务与自行部署的全面指南
开发语言·数据库·数据仓库·云计算·azure
weixin_307779132 天前
AWS Redshift 数据仓库完整配置与自动化管理指南
开发语言·数据仓库·python·云计算·aws
yumgpkpm2 天前
CMP (类ClouderaCDP7.3(404次编译) )华为鲲鹏Aarch64(ARM)信创环境多个mysql数据库汇聚的操作指南
大数据·hive·hadoop·zookeeper·big data·cloudera
华阙之梦2 天前
【在 Windows 上运行 Apache Hadoop 或 Spark/GeoTrellis 涉及 HDFS 】
hadoop·windows·apache
还是大剑师兰特2 天前
Hadoop面试题及详细答案 110题 (96-105)-- Hadoop性能优化
hadoop·大剑师·hadoop面试题
ApacheSeaTunnel3 天前
新兴数据湖仓手册·从分层架构到数据湖仓架构(2025):数据仓库分层的概念与设计
大数据·数据仓库·开源·数据湖·dataops·白鲸开源·底层技术