hive将时间字符串转换为timestamp的几种写法

写法一

sql 复制代码
select from_utc_timestamp(from_unixtime(unix_timestamp('2023-8-7 9:38:10 UTC+08:00', 'yyyy-MM-dd HH:mm:ss')), 'UTC');

写法二

sql 复制代码
select cast(unix_timestamp('2023-8-7 9:38:10 UTC+08:00', 'yyyy-MM-dd HH:mm:ss') as timestamp);

写法三

sql 复制代码
select cast(trim(split(upper('2023-10-31 4:46:40 UTC+0800'), 'UTC')[0]) as timestamp); 

这种方式我觉得过于复杂了。

使用到的函数

unix_timestamp

  • 函数签名
bash 复制代码
bigint unix_timestamp(string datetime, string format)
  • 函数返回值

    bigint类型的时间戳整数

  • 函数入参

    第一个参数是string类型的时间,比如'2024-01-10 20:44:00'。

    第二个参数是string类型的时间格式化的格式,比如'yyyy-MM-dd HH:mm:ss'。

  • 函数使用

bash 复制代码
-- 将给定时间字符串转换为指定格式的时间戳数字
select unix_timestamp('2023-12-4 4:45:12 UTC+08:00', 'yyyy-MM-dd HH:mm:ss');
-- 输出为1701619200
bash 复制代码
-- 获取当前时间戳
select unix_timestamp();
  • 注意点
    方法的返回值在spark中可以直接强转为timestamp。
    在hive中不能直接转为timestamp,强转会转为很奇怪的时间。
    如果要在hive中将此函数返回值转为timestamp,则需要使用cast函数转为timestamp。

from_unixtime

  • 函数签名
bash 复制代码
string from_unixtime(bigint time, string fromat)
  • 函数返回值

  • 函数参数

    bigint类型的时间戳。

    string类型的格式,用于指定函数返回值的格式,可以省略,如果省略,则默认为'yyyy-MM-dd HH:mm:ss'

  • 函数使用

bash 复制代码
select from_unixtime(1701619200, 'yyyy-MM-dd HH:mm:ss');
bash 复制代码
-- 省略format
select from_unixtime(1701619200);

测试

可以使用以下字符串作为输入进行测试。

以下各市的字符串经过在beeline客户端进行测试,均能转换为timestamp,且时间精度不会丢失

sql 复制代码
2023-8-31 15:40:56

-- 能够将带有UTC格式的字符串转换为时间戳,然后再转换为timestamp。
-- 但是会有8个小时的误差,上述的方法貌似是直接把UTC字符串给去掉了。                                                                                                                                                          
2023-12-4 4:45:12 UTC+0800

2023-10-17 3:38:1 UTC+0800

2023-5-3 13:7:0

2024-01-10 20:44:00.048

参考

unix_timestamp 时间戳函数用法(hive)

相关推荐
AC赳赳老秦15 小时前
Python 爬虫进阶:DeepSeek 优化反爬策略与动态数据解析逻辑
开发语言·hadoop·spring boot·爬虫·python·postgresql·deepseek
zgl_2005377915 小时前
ZGLanguage 解析SQL数据血缘 之 标识提取SQL语句中的目标表
java·大数据·数据库·数据仓库·hadoop·sql·源代码管理
yumgpkpm18 小时前
AI评判:信创替代对Cloudera CDH CDP Hadoop大数据平台有何影响?
大数据·hive·oracle·flink·kafka·hbase·cloudera
sheji34161 天前
【开题答辩全过程】以 基于Hadoop教育平台的设计与实现为例,包含答辩的问题和答案
大数据·hadoop·分布式
yumgpkpm1 天前
Cloudera CDH5、CDH6、CDP7现状及替代方案
数据库·人工智能·hive·hadoop·elasticsearch·数据挖掘·kafka
sq07231 天前
数据仓库工具箱:缓慢渐变维度(SCD)
数据仓库
毕设源码-钟学长1 天前
【开题答辩全过程】以 基于Hadoop的新闻推荐系统为例,包含答辩的问题和答案
大数据·hadoop·分布式
TTBIGDATA1 天前
【Knox编译】xmlsectool 依赖缺失问题解析
大数据·hadoop·ambari·hdp·kerberos·knox·bigtop
TTBIGDATA2 天前
【Knox编译】webhdfs-test 依赖收敛冲突问题处理
大数据·hadoop·ambari·hdp·kerberos·knox·bigtop
Databend2 天前
Databend 2025:海量数据 × AI 一体化底座,v1.3 即将发布
大数据·数据仓库