【数据开发】HiveSQL 临时表&分步执行(with, as )与时间函数(时间戳unix_timestamp)

1、分步执行(with...as...)

Hive SQL中的WITH...AS...语句可以用于分步执行,即将一个大的查询语句拆分成多个小的查询语句,每个小的查询语句都可以使用WITH...AS...语句定义一个临时表,然后在后面的查询语句中使用这些临时表。

用法1,增加一张临时表/临时步骤

sql 复制代码
with table1 as (
   select key from src where key = '5'
)
select * from table1;

用法2,增加并列临时表

sql 复制代码
with 
table1 as (
	select key from table2 where key = '5'
),
table2 as (
	select key from src where key = '5'
)
select * from (
	select key from table1
)record;

用法3,增加嵌套临时表(最常用)

sql 复制代码
with tmp2 as (
    with tmp1 as (
        select * from xxx
    )
    select * from tmp1
)
select * from tmp2;

入门的例子:

sql 复制代码
WITH temp1 AS (
  SELECT column1, column2
  FROM table1
  WHERE column3 = 'value'
),
temp2 AS (
  SELECT column4, column5
  FROM table2
  WHERE column6 = 'value'
)
SELECT temp1.column1, temp2.column4
FROM temp1
JOIN temp2
ON temp1.column2 = temp2.column5;

在上面的示例中,我们将大的查询语句分成了两个小的查询语句,分别定义了两个临时表temp1和temp2,然后在最后的查询语句中使用了这两个临时表。

使用WITH...AS...语句可以让查询语句更加清晰易懂,同时也可以提高查询效率,因为每个临时表只需要被计算一次,然后就可以在后面的查询语句中反复使用。

2、时间函数

Hive SQL中有许多日期和时间函数,可以用于处理日期和时间类型的数据。以下是一些常用的日期和时间函数:

  1. YEAR(date):返回日期中的年份。

  2. MONTH(date):返回日期中的月份。

  3. DAY(date):返回日期中的日。

  4. HOUR(timestamp):返回时间戳中的小时。

  5. MINUTE(timestamp):返回时间戳中的分钟。

  6. SECOND(timestamp):返回时间戳中的秒。

  7. DATE_FORMAT(date, format):将日期格式化为指定的格式。

  8. FROM_UNIXTIME(unix_timestamp, format):将Unix时间戳转换为日期格式。

  9. TO_DATE(date):将日期时间戳转换为日期。

  10. UNIX_TIMESTAMP([date, format]):将日期转换为Unix时间戳。

  11. CURRENT_DATE():返回当前日期。

  12. CURRENT_TIMESTAMP():返回当前时间戳。

以下是一些示例:

sql 复制代码
-- 返回当前日期
SELECT CURRENT_DATE();

-- 返回当前时间戳
SELECT CURRENT_TIMESTAMP();

-- 返回日期中的年份
SELECT YEAR('2022-01-01');

-- 返回日期中的月份
SELECT MONTH('2022-01-01');

-- 返回日期中的日
SELECT DAY('2022-01-01');

-- 返回时间戳中的小时
SELECT HOUR('2022-01-01 12:34:56');

-- 返回时间戳中的分钟
SELECT MINUTE('2022-01-01 12:34:56');

-- 返回时间戳中的秒
SELECT SECOND('2022-01-01 12:34:56');

-- 将日期格式化为指定的格式
SELECT DATE_FORMAT('2022-01-01', 'yyyy-MM-dd');

-- 将Unix时间戳转换为日期格式
SELECT FROM_UNIXTIME(1641026400, 'yyyy-MM-dd HH:mm:ss');

-- 将日期时间戳转换为日期
SELECT TO_DATE('2022-01-01 12:34:56');

-- 将日期转换为Unix时间戳
SELECT UNIX_TIMESTAMP('2022-01-01 12:34:56');

这些函数可以帮助我们更方便地处理日期和时间类型的数据。

参考资料:1, 2

相关推荐
五阿哥永琪3 分钟前
MySQL 慢查询定位与 SQL 性能优化实战指南
sql·mysql·性能优化
C++业余爱好者1 小时前
SQL语言家族入门指南:标准SQL、T-SQL与PL/SQL详解
数据库·sql
白衣衬衫 两袖清风1 小时前
ABP框架+Dapper执行原生sql
sql·c#·.net
西格电力科技1 小时前
面向工业用户的绿电直连架构适配技术:高可靠与高弹性的双重设计
大数据·服务器·人工智能·架构·能源
小程故事多_801 小时前
开源界核弹级输出!蚂蚁 Agentar-Scale-SQL 凭 “编排式扩展” 技术,成为 Text-to-SQL 天花板
数据库·人工智能·sql·开源·aigc·embedding
beijingliushao3 小时前
105-Spark之Standalone HA环境搭建过程
大数据·spark
五阿哥永琪3 小时前
Git 开发常用命令速查手册
大数据·git·elasticsearch
数字会议深科技3 小时前
深科技 | 高端会议室效率升级指南:无纸化会议系统的演进与价值
大数据·人工智能·会议系统·无纸化·会议系统品牌·综合型系统集成商·会议室
jinxinyuuuus3 小时前
vsGPU:硬件参数的数据仓库设计、ETL流程与前端OLAP分析
前端·数据仓库·etl
容智信息4 小时前
容智Report Agent智能体驱动财务自动化,从核算迈向价值创造
大数据·运维·人工智能·自然语言处理·自动化·政务