hive load data未正确读取到日期

1.源数据CSV文件日期字段值:

2.hive DDL语句:

sql 复制代码
CREATE EXTERNAL TABLE `test.textfile_table1`(
  `id` int COMMENT '????', 
  `name` string COMMENT '??', 
  `gender` string COMMENT '??', 
  `birthday` date COMMENT '????',.......)
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 
WITH SERDEPROPERTIES ( 
  'field.delim'=',', 
  'line.delim'='\n', 
  'serialization.format'=',') 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'hdfs://ambari-hadoop1:8020/warehouse/tablespace/external/hive/test.db/textfile_table1'
TBLPROPERTIES (
  'bucketing_version'='2', 
  'discover.partitions'='true', 
  'transient_lastDdlTime'='1708312247');

3.利用LOAD DATA 加载语句加载数据后发现date日期字段未被成功加载:

4.猜测为日期格式问题,在hive中日期格式如下YYYY-MM-DD,而CSV中是YYYY/MM/DD:

调整后成功解决。

5.原因分析:利用dbeaver三方工具导出CSV文件后,利用WPS打开编辑保存后,YYYY-MM-DD被更改为YYYY/MM/DD导致load data失败。

相关推荐
IT成长日记40 分钟前
【Hive入门】Hive增量数据导入:基于Sqoop的关系型数据库同步方案深度解析
数据库·hive·sqoop·关系型数据库同步·增量数据导入
洋芋爱吃芋头2 小时前
hadoop中的序列化和反序列化(2)
大数据·hadoop·分布式
End9286 小时前
MapReduce中的分区器
大数据·hadoop
小Tomkk6 小时前
怎么在非 hadoop 用户下启动 hadoop
大数据·hadoop·问题
心碎土豆块6 小时前
ETL介绍
数据仓库·etl
猫头虎6 小时前
如何在金仓数据库KingbaseES中新建一个数据库?新建一个表?给表添加一个字段?
数据库·数据仓库·sql·oracle·database·kingbasees·金仓数据库
麻芝汤圆18 小时前
在 Sheel 中运行 Spark:开启高效数据处理之旅
大数据·前端·javascript·hadoop·分布式·ajax·spark
IvanCodes19 小时前
二、Hadoop狭义和广义的理解
大数据·hadoop·分布式
IT成长日记1 天前
【Hive入门】Hive安全管理与权限控制:审计日志全解析,构建完善的操作追踪体系
hive·hadoop·安全·审计日志
IT成长日记1 天前
【Hive入门】Hive安全管理与权限控制:用户认证与权限管理深度解析
hive·hadoop·安全·权限管理·用户认证