hive中split函数相关总结

目录

split 函数一直再用,居然发现没有总结,遂补充一下;

split函数

在Hive中,split函数用于将一个字符串根据指定的分隔符进行分割,并返回一个数组。它的语法如下:

sql 复制代码
split(str, pat)

示例

假设有一个包含逗号分隔的字符串"apple,banana,orange",我们可以使用split函数按逗号分割这个字符串,并返回一个包含"apple"、"banana"和"orange"的数组:

sql 复制代码
SELECT split('apple,banana,orange', ',');

实战

sql 复制代码
select  
	imei
	,split(content_id,'\\_')[0] as source
	,sum(play_cnt ) as play_cnt
from  table_1
grouo by imei,split(content_id,'\\_')[0]

注意事项

1.split 分割后是形成一个数组,如果取第一个值,这个和取数组第一个值是类似的,取下标,所以第一个值的下标为0;

2.与截取函数比较substr从第1位截取到10位,是substr(contend_id,1,10),这个是从1开始的,需要区别开;

3.当涉及稍微复杂的例子时,我们可以考虑使用split函数来处理包含更多分隔符的字符串,并结合LATERAL VIEW和explode函数来展开数组;

比如以下例子:

sql 复制代码
SELECT id, prop
FROM table1
LATERAL VIEW explode(split(properties, ',')) propTable AS prop;

4.切割时,当逗号作为分隔符时,保持不变,其他多数时候要加转义,如split(properties,'\_'),split(properties,',')

相关推荐
珠海西格电力3 分钟前
零碳园区能源互联技术路径适配方案的成本效益分析
大数据·人工智能·架构·智慧城市·能源
尽兴-21 分钟前
Elasticsearch 高可用集群架构:Master 选举、Shard 分配与容灾设计
大数据·elasticsearch·架构·集群·节点·可视化工具·分片
Elastic 中国社区官方博客26 分钟前
从 Elasticsearch runtime fields 到 ES|QL:将传统工具适配到当前技术
大数据·数据库·sql·elasticsearch·搜索引擎·全文检索
沫儿笙31 分钟前
KUKA库卡焊接机器人智能节气仪
大数据·人工智能·机器人
Jane - UTS 数据传输系统1 小时前
从 WDO 成立看跨境数据同步:架构设计、技术拆解与最佳实践
大数据·数据库·国产替代·wdo·跨境数据同步·数据异构
源码之家1 小时前
计算机毕业设计:汽车销售数据采集分析系统 Flask框架 requests爬虫 可视化 数据分析 大数据 机器学习 大模型(建议收藏)✅
大数据·爬虫·python·信息可视化·flask·汽车·课程设计
冯RI375II694871 小时前
UN38.3报告运输鉴定书是什么?
大数据
2601_955363151 小时前
技术迭代下B端拓客:号码核验的行业进化与价值回归,氪迹科技法人股东号码筛选系统,阶梯式价格
大数据·人工智能
苛子13 小时前
2026国产化iPaaS集成平台选型与替换实战指南
数据仓库·etl
AI先驱体验官13 小时前
智能体变现:从技术实现到产品化的实践路径
大数据·人工智能·深度学习·重构·aigc