Hive:transform和udf

工作中发现有时候会用到python脚本进行数据计算,但是现在貌似已经不这样再处理,一般使用封装好的udf函数。

transform的基本用法为:

transform中的值作为输入, 然后传递给python脚本,最后经过python的处理后,输出想要得到的字符串格式。

transform的基本语法为:

sql 复制代码
select transform(intput columns)
using 'python *.py'
as (output columns)

注意:在利用本地的python处理时,首先需要add file *.py;

参考文档
Hive的Transform和UDF
Hive------巧用transform处理复杂的字符串问题

相关推荐
Agatha方艺璇17 小时前
Hive基础简介
数据仓库·hive·hadoop
Leo.yuan21 小时前
不同数据仓库模型有什么不同?企业如何选择适合的数据仓库模型?
大数据·数据库·数据仓库·信息可视化·spark
chat2tomorrow21 小时前
数据采集平台的起源与演进:从ETL到数据复制
大数据·数据库·数据仓库·mysql·低代码·postgresql·etl
DashingGuy2 天前
数仓建模理论
数据仓库
像豆芽一样优秀2 天前
Hive和Flink数据倾斜问题
大数据·数据仓库·hive·hadoop·flink
howard20053 天前
VMWare上搭建Hive集群
hive·hadoop
aristo_boyunv3 天前
拦截器和过滤器(理论+实操)
java·数据仓库·hadoop·servlet
元媛媛3 天前
数据仓库概要
数据仓库
cg.family3 天前
Doris 数据仓库例子
数据仓库·doris