hive中split函数相关总结

目录

split 函数一直再用,居然发现没有总结,遂补充一下;

split函数

在Hive中,split函数用于将一个字符串根据指定的分隔符进行分割,并返回一个数组。它的语法如下:

sql 复制代码
split(str, pat)

示例

假设有一个包含逗号分隔的字符串"apple,banana,orange",我们可以使用split函数按逗号分割这个字符串,并返回一个包含"apple"、"banana"和"orange"的数组:

sql 复制代码
SELECT split('apple,banana,orange', ',');

实战

sql 复制代码
select  
	imei
	,split(content_id,'\\_')[0] as source
	,sum(play_cnt ) as play_cnt
from  table_1
grouo by imei,split(content_id,'\\_')[0]

注意事项

1.split 分割后是形成一个数组,如果取第一个值,这个和取数组第一个值是类似的,取下标,所以第一个值的下标为0;

2.与截取函数比较substr从第1位截取到10位,是substr(contend_id,1,10),这个是从1开始的,需要区别开;

3.当涉及稍微复杂的例子时,我们可以考虑使用split函数来处理包含更多分隔符的字符串,并结合LATERAL VIEW和explode函数来展开数组;

比如以下例子:

sql 复制代码
SELECT id, prop
FROM table1
LATERAL VIEW explode(split(properties, ',')) propTable AS prop;

4.切割时,当逗号作为分隔符时,保持不变,其他多数时候要加转义,如split(properties,'\_'),split(properties,',')

相关推荐
腾视科技24 分钟前
安全驾驶 智在掌控|腾视科技ES06终端,为车辆运营赋能
大数据·人工智能·科技·安全·大模型
zandy10111 小时前
2025企业级智能体平台架构拆解: 如何安全合规下构筑强大的护城河
大数据·安全·架构·智能体
TDengine (老段)2 小时前
从“事后抢险”到“事前防控”:江西水投用 TDengine 时序数据库重塑防汛模式
大数据·数据库·物联网·时序数据库·tdengine·涛思数据·1024程序员节
yy7634966684 小时前
WPF 之 简单高效的Revit多语言支持方案
java·大数据·linux·服务器·wpf
渲吧云渲染7 小时前
SaaS模式重构工业软件竞争规则,助力中小企业快速实现数字化转型
大数据·人工智能·sass
青云交9 小时前
Java 大视界 -- 基于 Java 的大数据机器学习模型在图像识别中的迁移学习与模型优化
java·大数据·迁移学习·图像识别·模型优化·deeplearning4j·机器学习模型
java_logo15 小时前
Docker 部署 Elasticsearch 全流程手册
大数据·运维·mongodb·elasticsearch·docker·容器
墨香幽梦客16 小时前
掌控制造脉络:电子元器件行业常用ERP系统概览与参考指南
大数据·人工智能
B站_计算机毕业设计之家16 小时前
python舆情分析可视化系统 情感分析 微博 爬虫 scrapy爬虫技术 朴素贝叶斯分类算法大数据 计算机✅
大数据·爬虫·python·scrapy·数据分析·1024程序员节·舆情分析
汤姆yu16 小时前
2026版基于python大数据的电影分析可视化系统
大数据·python·1024程序员节·电影分析可视化