hive两张表实现like模糊匹配关联

sql 复制代码
testa表(字段a)
  aaa
  bba
  cccddd
  dddaaa

testb表(字段b)
   a
   b
   
1. 使用like+concat模糊配对
select
   a.a
from testa a ,testb b
where a like concat('%',b.b,'%')
group by a.a

2. 使用locate函数
select
   a.a
from testa a ,testb b
where locate(b.b,a.a)>0
group by a.a

3. 使用instr函数
select
   a.a
from testa a ,testb b
where instr(a.a,b.b)>0
group by a.a

3. 使用split函数
select
   a.a
from testa a ,testb b
where split(a.a,b.b)[1] is not null
group by a.a

注:

1.需要除重操作,比如:a表符合b两个将产生两条记录。

2.上面都会产生笛卡尔积,所以要注意数据量级。如果两个表都比较大,可以考虑将表拆分分别关联。

3.like效率比较低最好少用

相关推荐
咖啡里的茶i2 小时前
在Docker环境中安装Hadoop cluster 实验报告一
hadoop·docker·容器
青春万岁!!3 小时前
hive模型数据异常-作业调度问题
大数据·数据仓库·hive
白日与明月10 小时前
Hive分桶机制应用
数据仓库·hive·hadoop
Msshu12311 小时前
XSP25全协议 100W PD快充诱骗芯片_串口读电压电流信息
hive·云计算·json·database·memcached
水火既济__11 小时前
大数据hive_mr压缩问题
大数据·hive·mr
水火既济__11 小时前
hive中加载json数据建表(大规模)
hive·hadoop·json
承渊政道15 小时前
数据删了不等于销毁:KingbaseES敏感数据物理擦除实战指南
运维·服务器·数据库·数据仓库·安全·oracle·业界资讯
修先生1 天前
Hive Udf函数AES加密
hive·aes·udf
SeaTunnel2 天前
Apache SeaTunnel 4 月有何新动作?连接器增强与 Zeta 稳定性提升等亮点速览
大数据·数据仓库·spark·apache·seatunnel
Volunteer Technology2 天前
HDFS源码(二)
大数据·hadoop·hdfs