Spark SQL中时间戳条件约束与字符串判空

sql 复制代码
SELECT 
    -- 成员id
    distinct_id AS member_id, 
    -- 浏览时长
    get_json_object(all_json, '$.properties.event_duration') AS brow_duration,
    -- 浏览退出时间
    from_unixtime(CAST(get_json_object(all_json, '$.time') AS DOUBLE) / 1000) AS out_time,
    -- 内容编号
    regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1) AS number
FROM {args['TABLE_NAME']} 
WHERE event = '$MPPageLeave' AND LENGTH(distinct_id)<30 
    AND get_json_object(all_json, '$.time') is not null 
    AND get_json_object(all_json, '$.properties.$url_query') is not null
    AND regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1) is not null
    AND TRIM(regexp_extract(get_json_object(all_json, '$.properties.$url_query'), 'id=([^&]*)', 1)) != ''
    AND created_at >= unix_timestamp('2026-01-20 00:00:00')
    AND created_at < unix_timestamp('2026-01-21 00:00:00');

参考

相关推荐
无忧智库10 小时前
某市“十五五“知识产权大数据监管平台与全链条保护系统建设方案深度解读(WORD)
大数据·人工智能
综合热讯10 小时前
股票融资融券交易时间限制一览与制度说明
大数据·人工智能·区块链
华农DrLai10 小时前
Spark SQL Catalyst 优化器详解
大数据·hive·sql·flink·spark
数据知道10 小时前
PostgreSQL 故障排查:紧急排查与 SQL 熔断处理(CPU 占用 100% 等情况)
数据库·sql·postgresql
Pluchon10 小时前
硅基计划4.0 算法 简单模拟实现位图&布隆过滤器
java·大数据·开发语言·数据结构·算法·哈希算法
岁岁种桃花儿10 小时前
Flink从入门到上天系列第一篇:搭建第一个Flink程序
大数据·linux·flink·数据同步
历程里程碑10 小时前
普通数组-----除了自身以外数组的乘积
大数据·javascript·python·算法·elasticsearch·搜索引擎·flask
无忧智库10 小时前
某市“十五五”智慧教育2.0建设方案深度解读:从数字化转型到数智化融合的跨越之路(WORD)
大数据
eyun_1850010 小时前
把健康小屋搬进单位 让职工暖心 让履职安心
大数据·人工智能·经验分享
会飞的老朱14 小时前
医药集团数智化转型,智能综合管理平台激活集团管理新效能
大数据·人工智能·oa协同办公