hive中split函数相关总结

目录

split 函数一直再用,居然发现没有总结,遂补充一下;

split函数

在Hive中,split函数用于将一个字符串根据指定的分隔符进行分割,并返回一个数组。它的语法如下:

sql 复制代码
split(str, pat)

示例

假设有一个包含逗号分隔的字符串"apple,banana,orange",我们可以使用split函数按逗号分割这个字符串,并返回一个包含"apple"、"banana"和"orange"的数组:

sql 复制代码
SELECT split('apple,banana,orange', ',');

实战

sql 复制代码
select  
	imei
	,split(content_id,'\\_')[0] as source
	,sum(play_cnt ) as play_cnt
from  table_1
grouo by imei,split(content_id,'\\_')[0]

注意事项

1.split 分割后是形成一个数组,如果取第一个值,这个和取数组第一个值是类似的,取下标,所以第一个值的下标为0;

2.与截取函数比较substr从第1位截取到10位,是substr(contend_id,1,10),这个是从1开始的,需要区别开;

3.当涉及稍微复杂的例子时,我们可以考虑使用split函数来处理包含更多分隔符的字符串,并结合LATERAL VIEW和explode函数来展开数组;

比如以下例子:

sql 复制代码
SELECT id, prop
FROM table1
LATERAL VIEW explode(split(properties, ',')) propTable AS prop;

4.切割时,当逗号作为分隔符时,保持不变,其他多数时候要加转义,如split(properties,'\_'),split(properties,',')

相关推荐
Dxy123931021643 分钟前
Elasticsearch 索引与映射:为你的数据打造一个“智能仓库”
大数据·elasticsearch·搜索引擎
岁岁种桃花儿1 小时前
Kafka从入门到上天系列第一篇:kafka的安装和启动
大数据·中间件·kafka
Apache Flink2 小时前
Apache Flink Agents 0.2.0 发布公告
大数据·flink·apache
永霖光电_UVLED2 小时前
打造更优异的 UVB 激光器
大数据·制造·量子计算
m0_466525292 小时前
绿盟科技风云卫AI安全能力平台成果重磅发布
大数据·数据库·人工智能·安全
晟诺数字人2 小时前
2026年海外直播变革:数字人如何改变游戏规则
大数据·人工智能·产品运营
vx_biyesheji00012 小时前
豆瓣电影推荐系统 | Python Django 协同过滤 Echarts可视化 深度学习 大数据 毕业设计源码
大数据·爬虫·python·深度学习·django·毕业设计·echarts
2501_943695333 小时前
高职大数据与会计专业,考CDA证后能转纯数据分析岗吗?
大数据·数据挖掘·数据分析
实时数据3 小时前
通过大数据的深度分析与精准营销策略,企业能够有效实现精准引流
大数据
AC赳赳老秦3 小时前
代码生成超越 GPT-4:DeepSeek-V4 编程任务实战与 2026 开发者效率提升指南
数据库·数据仓库·人工智能·科技·rabbitmq·memcache·deepseek