hive中split函数相关总结

目录

split 函数一直再用,居然发现没有总结,遂补充一下;

split函数

在Hive中,split函数用于将一个字符串根据指定的分隔符进行分割,并返回一个数组。它的语法如下:

sql 复制代码
split(str, pat)

示例

假设有一个包含逗号分隔的字符串"apple,banana,orange",我们可以使用split函数按逗号分割这个字符串,并返回一个包含"apple"、"banana"和"orange"的数组:

sql 复制代码
SELECT split('apple,banana,orange', ',');

实战

sql 复制代码
select  
	imei
	,split(content_id,'\\_')[0] as source
	,sum(play_cnt ) as play_cnt
from  table_1
grouo by imei,split(content_id,'\\_')[0]

注意事项

1.split 分割后是形成一个数组,如果取第一个值,这个和取数组第一个值是类似的,取下标,所以第一个值的下标为0;

2.与截取函数比较substr从第1位截取到10位,是substr(contend_id,1,10),这个是从1开始的,需要区别开;

3.当涉及稍微复杂的例子时,我们可以考虑使用split函数来处理包含更多分隔符的字符串,并结合LATERAL VIEW和explode函数来展开数组;

比如以下例子:

sql 复制代码
SELECT id, prop
FROM table1
LATERAL VIEW explode(split(properties, ',')) propTable AS prop;

4.切割时,当逗号作为分隔符时,保持不变,其他多数时候要加转义,如split(properties,'\_'),split(properties,',')

相关推荐
西格电力科技2 分钟前
为何要配光伏储能协调控制服务器?核心价值与应用必要性
大数据·运维·服务器·人工智能·架构·能源
数智顾问11 分钟前
(100页PPT)十分钟学懂战略地图(附下载方式)
大数据·人工智能
ranchor66615 分钟前
df赋值和.copy的区别(SettingWithCopyWarning)
大数据·人工智能·python
UI设计兰亭妙微15 分钟前
医疗 UX 的 “精准温度”:从 LUTRONIC AM10 看北京兰亭妙微眼中的医疗界面革新
大数据·人工智能·ux·ui设计外包
Elastic 中国社区官方博客35 分钟前
AutoOps 实际应用:调查 ECK 上的 Elasticsearch 集群性能
大数据·数据库·elasticsearch·搜索引擎·全文检索
老蒋新思维1 小时前
创客匠人万人峰会落幕:AI 智能体如何重塑知识变现的效率革命
大数据·人工智能·重构·创始人ip·创客匠人·知识变现
神算大模型APi--天枢6461 小时前
国产硬件架构大模型算力服务平台:本地化部署与标准端口开发的创新实践
大数据·人工智能·科技·深度学习·架构·硬件架构
老蒋新思维1 小时前
创客匠人万人峰会解码:AI+IP 能力裂变,知识变现告别 “单点依赖” 时代
大数据·网络·人工智能·tcp/ip·创始人ip·创客匠人·知识变现
Jackyzhe1 小时前
Flink学习笔记:如何做容错
大数据·flink
北京盛世宏博1 小时前
【物联网控制】档案库房八防智能监测系统 温湿度自动调控 + 防火防盗全联动
大数据·人工智能·档案八防·十防