【数据开发】HiveSQL 临时表&分步执行(with, as )与时间函数(时间戳unix_timestamp)

1、分步执行(with...as...)

Hive SQL中的WITH...AS...语句可以用于分步执行,即将一个大的查询语句拆分成多个小的查询语句,每个小的查询语句都可以使用WITH...AS...语句定义一个临时表,然后在后面的查询语句中使用这些临时表。

用法1,增加一张临时表/临时步骤

sql 复制代码
with table1 as (
   select key from src where key = '5'
)
select * from table1;

用法2,增加并列临时表

sql 复制代码
with 
table1 as (
	select key from table2 where key = '5'
),
table2 as (
	select key from src where key = '5'
)
select * from (
	select key from table1
)record;

用法3,增加嵌套临时表(最常用)

sql 复制代码
with tmp2 as (
    with tmp1 as (
        select * from xxx
    )
    select * from tmp1
)
select * from tmp2;

入门的例子:

sql 复制代码
WITH temp1 AS (
  SELECT column1, column2
  FROM table1
  WHERE column3 = 'value'
),
temp2 AS (
  SELECT column4, column5
  FROM table2
  WHERE column6 = 'value'
)
SELECT temp1.column1, temp2.column4
FROM temp1
JOIN temp2
ON temp1.column2 = temp2.column5;

在上面的示例中,我们将大的查询语句分成了两个小的查询语句,分别定义了两个临时表temp1和temp2,然后在最后的查询语句中使用了这两个临时表。

使用WITH...AS...语句可以让查询语句更加清晰易懂,同时也可以提高查询效率,因为每个临时表只需要被计算一次,然后就可以在后面的查询语句中反复使用。

2、时间函数

Hive SQL中有许多日期和时间函数,可以用于处理日期和时间类型的数据。以下是一些常用的日期和时间函数:

  1. YEAR(date):返回日期中的年份。

  2. MONTH(date):返回日期中的月份。

  3. DAY(date):返回日期中的日。

  4. HOUR(timestamp):返回时间戳中的小时。

  5. MINUTE(timestamp):返回时间戳中的分钟。

  6. SECOND(timestamp):返回时间戳中的秒。

  7. DATE_FORMAT(date, format):将日期格式化为指定的格式。

  8. FROM_UNIXTIME(unix_timestamp, format):将Unix时间戳转换为日期格式。

  9. TO_DATE(date):将日期时间戳转换为日期。

  10. UNIX_TIMESTAMP(date, format):将日期转换为Unix时间戳。

  11. CURRENT_DATE():返回当前日期。

  12. CURRENT_TIMESTAMP():返回当前时间戳。

以下是一些示例:

sql 复制代码
-- 返回当前日期
SELECT CURRENT_DATE();

-- 返回当前时间戳
SELECT CURRENT_TIMESTAMP();

-- 返回日期中的年份
SELECT YEAR('2022-01-01');

-- 返回日期中的月份
SELECT MONTH('2022-01-01');

-- 返回日期中的日
SELECT DAY('2022-01-01');

-- 返回时间戳中的小时
SELECT HOUR('2022-01-01 12:34:56');

-- 返回时间戳中的分钟
SELECT MINUTE('2022-01-01 12:34:56');

-- 返回时间戳中的秒
SELECT SECOND('2022-01-01 12:34:56');

-- 将日期格式化为指定的格式
SELECT DATE_FORMAT('2022-01-01', 'yyyy-MM-dd');

-- 将Unix时间戳转换为日期格式
SELECT FROM_UNIXTIME(1641026400, 'yyyy-MM-dd HH:mm:ss');

-- 将日期时间戳转换为日期
SELECT TO_DATE('2022-01-01 12:34:56');

-- 将日期转换为Unix时间戳
SELECT UNIX_TIMESTAMP('2022-01-01 12:34:56');

这些函数可以帮助我们更方便地处理日期和时间类型的数据。

参考资料:1, 2

相关推荐
云技纵横12 小时前
唯一索引 INSERT 死锁实战:5 秒复现交叉插入的 S 锁循环等待
sql·mysql
得物技术1 天前
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
大数据·llm·ai编程
久美子2 天前
AI驱动数仓建设的Harness工程实践——本体建模、知识分层与上下文工程
大数据
大树882 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
大志哥1232 天前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch
果丁智能2 天前
物联网智能锁赋能集中式住宿:身份核验与远程权限管控的全链路技术实践
大数据·人工智能·物联网·智能家居
王小王-1232 天前
基于 Hive 的网易云音乐数据分析及可视化系统
hive·hadoop·数据分析·音乐数据分析·网易云音乐分析·hive音乐分析·hadoop网易云
ApacheSeaTunnel2 天前
实战演示 | 基于 Apache SeaTunnel 与 Apache DolphinScheduler 实现 MySQL 到 Doris 离线定时增量同步
大数据·mysql·开源·doris·数据集成·seatunnel·数据同步
古城小栈2 天前
Unix 与 Linux 异同小叙
linux·服务器·unix
weixin_397574092 天前
PDF复杂表格的1:1还原引擎:跨页表格自动拼接技术实战
大数据·人工智能·pdf