Spark SQL中时间戳条件约束与字符串判空

sql 复制代码
SELECT 
    -- 成员id
    distinct_id AS member_id, 
    -- 浏览时长
    get_json_object(all_json, '$.properties.event_duration') AS brow_duration,
    -- 浏览退出时间
    from_unixtime(CAST(get_json_object(all_json, '$.time') AS DOUBLE) / 1000) AS out_time,
    -- 内容编号
    regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1) AS number
FROM {args['TABLE_NAME']} 
WHERE event = '$MPPageLeave' AND LENGTH(distinct_id)<30 
    AND get_json_object(all_json, '$.time') is not null 
    AND get_json_object(all_json, '$.properties.$url_query') is not null
    AND regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1) is not null
    AND TRIM(regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1)) != ''
    AND created_at >= unix_timestamp('2026-01-20 00:00:00')
    AND created_at < unix_timestamp('2026-01-21 00:00:00');

参考

相关推荐
短剑重铸之日1 小时前
《ShardingSphere解读》16 改写引擎:如何理解装饰器模式下的 SQL 改写实现机制?
java·数据库·后端·sql·shardingsphere·分库分表·装饰器模式
坚持学习前端日记2 小时前
从零开始构建小说推荐智能体 - Coze 本地部署完整教程
大数据·人工智能·数据挖掘
IDIOT___IDIOT2 小时前
关于 git 进行版本管理的时候 gitignore 写入忽略规则而不生效的问题
大数据·git·elasticsearch
不想看见4042 小时前
Git 误删急救手册
大数据·git·elasticsearch
网络工程小王3 小时前
【大数据技术详解】——Elasticsearch技术(学习笔记)
大数据·大数据技术·向量查询
TOWE technology3 小时前
从“制造”到“智造”:智能PDU如何成为智慧工厂的电力“神经中枢”
大数据·人工智能·制造·数据中心·电源管理·智能pdu
umeelove353 小时前
SQL中的DISTINCT、SQL DISTINCT详解、DISTINCT的用法、DISTINCT注意事项
java·数据库·sql
@insist1233 小时前
数据库系统工程师-嵌入式 SQL 与存储过程核心原理与应试指南
数据库·sql·软考·数据库系统工程师·软件水平考试
2401_891655813 小时前
Git误操作急救手册大纲
大数据·elasticsearch·搜索引擎
zjneymar3 小时前
Mybatis的动态sql
java·sql·mybatis