SQL进阶技巧:非等值连接--单向近距离匹配

目录

[0 场景描述](#0 场景描述)

[1 数据准备](#1 数据准备)

[2 问题分析](#2 问题分析)

​编辑

​编辑

[3 小结](#3 小结)

数字化建设通关指南


0 场景描述

表 t_1 和表 t_2 通过 a 和 b 关联时,有相等的取相等的值匹配,不相等时每一 个 a 的值在 b 中找差值最小的来匹。

表 t_1:a 中无重复值

表 t_1:a 中无重复值

a 1 2 4 5 8 10

表 t_2:b 中无重复值 b 2 3 7 11 13

问题:单向最近匹配

输出结果如下所示:

注意:b 的值可能会被丢弃

a b

1 2

2 2

4 3

5 3

5 7

8 7

10 11

1 数据准备

sql 复制代码
create table t_1 as
    (select stack(
                    6,
                    1,
                    2,
                    4,
                    5,
                    8,
                    10
            ) as (a));

create table t_2 as
    (select stack(
                    5,
                    2,
                    3,
                    7,
                    11,
                    13
            ) as (b));

2 问题分析

步骤1:自关联,生成全量的数据集。并按照关联的结果集,按照abs(a-b)差值排序。注意差值有可能重复,因而采用dense_rank()

sql 复制代码
select a
     , b
     , abs(a-b) diff
     , dense_rank()  over (partition by a order by abs(a-b) )
from t_1,
     t_2

步骤2:过滤出rn=1 的值则为最终结果

sql 复制代码
select a, b
from (select a
           , b
           , abs(a - b)                                              diff
           , dense_rank() over (partition by a order by abs(a - b) ) rn
      from t_1,
           t_2) t
where rn = 1

3 小结

本文分析了一种非等值连接--单向近距离匹配的方法及技巧、

数字化建设通关指南

专栏原价99,现在活动价39.9,按照阶梯式增长,直到恢复原价

专栏优势:

(1)一次收费持续更新。

(2)实战中总结的SQL技巧,帮助SQLBOY 在SQL语言上有质的飞越,无论你应对业务难题及面试都会游刃有余【全网唯一讲SQL实战技巧,方法独特】

SQL很简单,可你却写不好?每天一点点,收获不止一点点-CSDN博客

(3)实战中数仓建模技巧总结,让你认识不一样的数仓。【数据建模+业务建模,不一样的认知体系】(如果只懂数据建模而不懂业务建模,数仓体系认知是不全面的)

(4)数字化建设当中遇到难题解决思路及问题思考。

我的专栏具体链接如下:

数字化建设通关指南_莫叫石榴姐的博客-CSDN博客

相关推荐
davawang10 分钟前
基于SQL实现分组的文字排序聚合
sql·分析函数·数据平台
2601_9549711322 分钟前
2026年大数据专业证书报考指南
大数据
JZC_xiaozhong36 分钟前
赛狐ERP订单如何自动同步到金蝶云星空?从发货到应收单生成,全程实时
大数据·数据挖掘·数据分析·数据集成与应用集成·赛狐erp集成·金蝶系统集成·系统应用对接
Tongpao_SSDHDD38 分钟前
希捷酷鹰ST6000VX008实测解析:中小安防监控高性价比存储方案
大数据·数据库·人工智能
jkyy201442 分钟前
车载健康座舱成新赛道?汽车健康数字化重塑出行新价值
大数据·人工智能·汽车·健康医疗
zhuhai_xigedian1 小时前
源网荷储一体化 vs 传统供用电模式:差异、优势与转型路径
大数据·人工智能·分布式·系统架构·能源
MetrixAeroCore1 小时前
智能电表海外通信解决方案:低功耗、高稳定远程抄表IoT连接
大数据·物联网
蓝鸟19741 小时前
Oracle超大DMP备份文件瘦身、日志精简、磁盘空间优化实战方案日志
数据库·oracle·数据库运维·生产运维实战·oracle避坑·磁盘空间优化·oracle日志清理
啾啾Fun1 小时前
【AI Coding】0-工程化视角理解AI Coding与LLM应用的上下文演化
大数据·人工智能