Spark SQL中时间戳条件约束与字符串判空

sql 复制代码
SELECT 
    -- 成员id
    distinct_id AS member_id, 
    -- 浏览时长
    get_json_object(all_json, '$.properties.event_duration') AS brow_duration,
    -- 浏览退出时间
    from_unixtime(CAST(get_json_object(all_json, '$.time') AS DOUBLE) / 1000) AS out_time,
    -- 内容编号
    regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1) AS number
FROM {args['TABLE_NAME']} 
WHERE event = '$MPPageLeave' AND LENGTH(distinct_id)<30 
    AND get_json_object(all_json, '$.time') is not null 
    AND get_json_object(all_json, '$.properties.$url_query') is not null
    AND regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1) is not null
    AND TRIM(regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1)) != ''
    AND created_at >= unix_timestamp('2026-01-20 00:00:00')
    AND created_at < unix_timestamp('2026-01-21 00:00:00');

参考

相关推荐
云边云科技_云网融合2 小时前
下单、收银不中断,负载均衡是零售系统平稳运行的基石
大数据·网络·人工智能·安全
℡終嚸♂6804 小时前
sql注入知识点(正则回溯绕过waf,CTF ez—RCE题目解析)
数据库·sql·oracle
延凡科技9 小时前
无人机低空智能巡飞巡检平台:全域感知与智能决策的低空作业中枢
大数据·人工智能·科技·安全·无人机·能源
百家方案10 小时前
2026年数据治理整体解决方案 - 全1066页下载
大数据·人工智能·数据治理
zhangkaixuan45611 小时前
Paimon 读取数据流程深度解析
大数据·hadoop·flink·apache·paimon
清平乐的技术专栏12 小时前
HBase集群连接方式
大数据·数据库·hbase
梁下轻语的秋缘14 小时前
Prompt工程核心指南:从入门到精通,让AI精准响应你的需求
大数据·人工智能·prompt
福客AI智能客服14 小时前
工单智转:电商智能客服与客服AI系统重构售后服务效率
大数据·人工智能
2601_9496130215 小时前
flutter_for_openharmony家庭药箱管理app实战+药品分类实现
大数据·数据库·flutter