hive load data未正确读取到日期

1.源数据CSV文件日期字段值:

2.hive DDL语句:

sql 复制代码
CREATE EXTERNAL TABLE `test.textfile_table1`(
  `id` int COMMENT '????', 
  `name` string COMMENT '??', 
  `gender` string COMMENT '??', 
  `birthday` date COMMENT '????',.......)
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 
WITH SERDEPROPERTIES ( 
  'field.delim'=',', 
  'line.delim'='\n', 
  'serialization.format'=',') 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'hdfs://ambari-hadoop1:8020/warehouse/tablespace/external/hive/test.db/textfile_table1'
TBLPROPERTIES (
  'bucketing_version'='2', 
  'discover.partitions'='true', 
  'transient_lastDdlTime'='1708312247');

3.利用LOAD DATA 加载语句加载数据后发现date日期字段未被成功加载:

4.猜测为日期格式问题,在hive中日期格式如下YYYY-MM-DD,而CSV中是YYYY/MM/DD:

调整后成功解决。

5.原因分析:利用dbeaver三方工具导出CSV文件后,利用WPS打开编辑保存后,YYYY-MM-DD被更改为YYYY/MM/DD导致load data失败。

相关推荐
嘉禾望岗5031 小时前
hive on tez运行及hive ha搭建
数据仓库·hive·hadoop
RestCloud6 小时前
PostgreSQL的数据集成之路:ETL+CDC实现实时多源聚合
数据库·数据仓库·postgresql·etl·数据处理·数据传输·数据同步
笨蛋少年派9 小时前
操作Hadoop时,慎用sudo
大数据·hadoop·分布式
hrrrrb11 小时前
【Spring Security】Spring Security 密码编辑器
java·hive·spring
二进制_博客1 天前
spark on hive 还是 hive on spark?
大数据·hive·spark
IT毕设梦工厂1 天前
大数据毕业设计选题推荐-基于大数据的人体生理指标管理数据可视化分析系统-Hadoop-Spark-数据可视化-BigData
大数据·hadoop·信息可视化·spark·毕业设计·源码·bigdata
云淡风轻~~1 天前
构建和部署Spark、Hadoop与Zeppelin集成环境
大数据·hadoop·spark
IT研究室1 天前
大数据毕业设计选题推荐-基于大数据的人体体能活动能量消耗数据分析与可视化系统-大数据-Spark-Hadoop-Bigdata
大数据·hadoop·数据分析·spark·毕业设计·源码·bigdata
大叔_爱编程1 天前
基于Python的交通数据分析应用-hadoop+django
hadoop·python·django·毕业设计·源码·课程设计·交通数据分析
Kay_Liang1 天前
数据仓库入门:从超市小票看懂数仓
数据仓库·笔记·数据分析