hive load data未正确读取到日期

1.源数据CSV文件日期字段值:

2.hive DDL语句:

sql 复制代码
CREATE EXTERNAL TABLE `test.textfile_table1`(
  `id` int COMMENT '????', 
  `name` string COMMENT '??', 
  `gender` string COMMENT '??', 
  `birthday` date COMMENT '????',.......)
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 
WITH SERDEPROPERTIES ( 
  'field.delim'=',', 
  'line.delim'='\n', 
  'serialization.format'=',') 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'hdfs://ambari-hadoop1:8020/warehouse/tablespace/external/hive/test.db/textfile_table1'
TBLPROPERTIES (
  'bucketing_version'='2', 
  'discover.partitions'='true', 
  'transient_lastDdlTime'='1708312247');

3.利用LOAD DATA 加载语句加载数据后发现date日期字段未被成功加载:

4.猜测为日期格式问题,在hive中日期格式如下YYYY-MM-DD,而CSV中是YYYY/MM/DD:

调整后成功解决。

5.原因分析:利用dbeaver三方工具导出CSV文件后,利用WPS打开编辑保存后,YYYY-MM-DD被更改为YYYY/MM/DD导致load data失败。

相关推荐
isNotNullX8 小时前
数据怎么分层?从ODS、DW、ADS三大层一一拆解!
大数据·开发语言·数据仓库·分布式·spark
随心............9 小时前
hive的相关的优化
数据仓库·hive·hadoop
亲亲菱纱11 小时前
数仓面试题
数据仓库
万能小锦鲤11 小时前
《大数据技术原理与应用》实验报告一 熟悉常用的Linux操作和Hadoop操作
大数据·linux·hadoop·ubuntu·vmware·实验报告·大数据技术原理与应用
码字的字节12 小时前
深入解析Hadoop中的HDFS架构设计
大数据·hadoop·hdfs
码字的字节12 小时前
深入探讨Hadoop YARN Federation:架构设计与实践应用
hadoop·yarn·federation
zhangjin122214 小时前
kettle从入门到精通 第九十七课 ETL之kettle kettle资源仓库的5种方式
数据仓库·etl·kettle插件·kettle资源仓库
liupenglove1 天前
自动驾驶数据仓库:时间片合并算法。
大数据·数据仓库·算法·elasticsearch·自动驾驶
吃手机用谁付的款2 天前
基于hadoop的竞赛网站日志数据分析与可视化(下)
大数据·hadoop·python·信息可视化·数据分析
码字的字节2 天前
深入解析Hadoop RPC:技术细节与推广应用
hadoop·rpc