Spark SQL中时间戳条件约束与字符串判空

sql 复制代码
SELECT 
    -- 成员id
    distinct_id AS member_id, 
    -- 浏览时长
    get_json_object(all_json, '$.properties.event_duration') AS brow_duration,
    -- 浏览退出时间
    from_unixtime(CAST(get_json_object(all_json, '$.time') AS DOUBLE) / 1000) AS out_time,
    -- 内容编号
    regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1) AS number
FROM {args['TABLE_NAME']} 
WHERE event = '$MPPageLeave' AND LENGTH(distinct_id)<30 
    AND get_json_object(all_json, '$.time') is not null 
    AND get_json_object(all_json, '$.properties.$url_query') is not null
    AND regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1) is not null
    AND TRIM(regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1)) != ''
    AND created_at >= unix_timestamp('2026-01-20 00:00:00')
    AND created_at < unix_timestamp('2026-01-21 00:00:00');

参考

相关推荐
大大大大晴天3 天前
Hudi Metadata Table 与 Hive Sync (HMS)怎么选?
大数据
唐青枫3 天前
MySQL JSON 实战详解:从存储、查询、更新到 JSON_TABLE 与索引
sql·mysql
手可摘星辰7773 天前
一次线上FlinkCDC异常排查复盘
大数据·flink
大大大大晴天3 天前
Hudi技术内幕:Metadata Table原理与实践
大数据
大大大大晴天4 天前
Hudi技术内幕:深入解析Index索引机制
大数据
阿里云大数据AI技术4 天前
Flink Forward Asia 2026 深圳启幕:Agentic Streaming for AI,开启实时智能新范式
大数据·flink
SelectDB5 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
掉头发的王富贵5 天前
【StarRocks】极限十分钟入门StarRocks
数据库·sql·mysql
大大大大晴天8 天前
Hudi技术内幕:RecordPayload到RecordMerger
大数据
SelectDB9 天前
秒级弹性、最高降本 70%:SelectDB Serverless 如何重塑云数仓资源效率
大数据·后端·云原生