hive中split函数相关总结

目录

split 函数一直再用,居然发现没有总结,遂补充一下;

split函数

在Hive中,split函数用于将一个字符串根据指定的分隔符进行分割,并返回一个数组。它的语法如下:

sql 复制代码
split(str, pat)

示例

假设有一个包含逗号分隔的字符串"apple,banana,orange",我们可以使用split函数按逗号分割这个字符串,并返回一个包含"apple"、"banana"和"orange"的数组:

sql 复制代码
SELECT split('apple,banana,orange', ',');

实战

sql 复制代码
select  
	imei
	,split(content_id,'\\_')[0] as source
	,sum(play_cnt ) as play_cnt
from  table_1
grouo by imei,split(content_id,'\\_')[0]

注意事项

1.split 分割后是形成一个数组,如果取第一个值,这个和取数组第一个值是类似的,取下标,所以第一个值的下标为0;

2.与截取函数比较substr从第1位截取到10位,是substr(contend_id,1,10),这个是从1开始的,需要区别开;

3.当涉及稍微复杂的例子时,我们可以考虑使用split函数来处理包含更多分隔符的字符串,并结合LATERAL VIEW和explode函数来展开数组;

比如以下例子:

sql 复制代码
SELECT id, prop
FROM table1
LATERAL VIEW explode(split(properties, ',')) propTable AS prop;

4.切割时,当逗号作为分隔符时,保持不变,其他多数时候要加转义,如split(properties,'\_'),split(properties,',')

相关推荐
Jackyzhe2 小时前
Flink源码阅读:JobManager的HA机制
大数据·flink
鲨莎分不晴2 小时前
大数据基石深度解析:系统性读懂 Hadoop 与 ZooKeeper
大数据·hadoop·zookeeper
Sylvan Ding8 小时前
度量空间数据管理与分析系统——大数据泛构课程作业-2025~2026学年. 毛睿
大数据·深圳大学·大数据泛构·度量空间数据管理与分析系统·毛睿·北京理工大学珠海校区
面向Google编程11 小时前
Flink源码阅读:JobManager的HA机制
大数据·flink
Tony Bai11 小时前
【分布式系统】03 复制(上):“权威中心”的秩序 —— 主从架构、一致性与权衡
大数据·数据库·分布式·架构
汽车仪器仪表相关领域13 小时前
全自动化精准检测,赋能高效年检——NHD-6108全自动远、近光检测仪项目实战分享
大数据·人工智能·功能测试·算法·安全·自动化·压力测试
大厂技术总监下海13 小时前
根治LLM胡说八道!用 Elasticsearch 构建 RAG,给你一个“有据可查”的AI
大数据·elasticsearch·开源
石像鬼₧魂石15 小时前
22端口(OpenSSH 4.7p1)渗透测试完整复习流程(含实战排错)
大数据·网络·学习·安全·ubuntu
TDengine (老段)15 小时前
TDengine Python 连接器进阶指南
大数据·数据库·python·物联网·时序数据库·tdengine·涛思数据
数据猿17 小时前
【金猿CIO展】如康集团CIO 赵鋆洲:数智重塑“顶牛”——如康集团如何用大数据烹饪万亿肉食产业的未来
大数据