Spark sql 常用时间函数 to_date ,datediff

1. to_date

`to_date` 是 Apache Spark 中的一个函数,用于将字符串或其他日期/时间格式转换为日期格式。这个函数通常在处理日期字符串时非常有用,尤其是当你需要将它们转换为标准的日期格式以进行进一步的操作或分析时。

例如,假设你有一个包含日期字符串的 DataFrame,并且这些字符串的格式为 "yyyy-MM-dd",你可以使用 `to_date` 函数将这些字符串转换为日期格式:

Scala 复制代码
import org.apache.spark.sql.functions._

val df = Seq("2022-01-01", "2022-01-02").toDF("date_string")
val dfWithDate = df.withColumn("date", to_date(col("date_string"), "yyyy-MM-dd"))
dfWithDate.show()

输出:

+-----------+--------------+

|date_string| date |

+-----------+--------------+

| 2022-01-01|2022-01-01|

| 2022-01-02|2022-01-02|

+-----------+------------------+


2.datediff

`datediff` 函数是 Spark SQL 中的一个日期函数,用于计算两个日期之间的天数差异。它接受两个日期作为输入,并返回两个日期之间的天数差。

函数原型如下:

Scala 复制代码
datediff(enddate: Column, startdate: Column): Column

其中,`enddate` 和 `startdate` 是两个日期列或者日期值。

下面是一个示例:

Scala 复制代码
import org.apache.spark.sql.functions.datediff
import org.apache.spark.sql.SparkSession

val spark = SparkSession.builder()
                        .appName("datediff example")
                        .getOrCreate()

import spark.implicits._

val df = Seq(("2021-01-01", "2021-01-10"), ("2021-02-01", "2021-02-10")).toDF("startdate", "enddate")

df.withColumn("diff", datediff($"enddate", $"startdate"))
  .show()

输出结果为:

+----------+----------+----+

| startdate| enddate|diff|

+----------+----------+----+

|2021-01-01|2021-01-10| 9|

|2021-02-01|2021-02-10| 9|

+----------+----------+----+

可以看到,`datediff` 函数计算了 `startdate` 到 `enddate` 之间的天数差异,并将结果添加到了新的一列 `diff` 中。


相关推荐
云技纵横21 小时前
唯一索引 INSERT 死锁实战:5 秒复现交叉插入的 S 锁循环等待
sql·mysql
得物技术2 天前
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
大数据·llm·ai编程
久美子2 天前
AI驱动数仓建设的Harness工程实践——本体建模、知识分层与上下文工程
大数据
大树883 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
大志哥1233 天前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch
果丁智能3 天前
物联网智能锁赋能集中式住宿:身份核验与远程权限管控的全链路技术实践
大数据·人工智能·物联网·智能家居
ApacheSeaTunnel3 天前
实战演示 | 基于 Apache SeaTunnel 与 Apache DolphinScheduler 实现 MySQL 到 Doris 离线定时增量同步
大数据·mysql·开源·doris·数据集成·seatunnel·数据同步
weixin_397574093 天前
PDF复杂表格的1:1还原引擎:跨页表格自动拼接技术实战
大数据·人工智能·pdf
极光代码工作室3 天前
基于数据仓库的电商数据分析平台
大数据·hadoop·python·spark·数据可视化
BD_Marathon3 天前
SQL学习指南——视图
数据库·sql