Hive:transform和udf

冬至喵喵2024-04-16 21:28

工作中发现有时候会用到python脚本进行数据计算，但是现在貌似已经不这样再处理，一般使用封装好的udf函数。

transform的基本用法为：

transform中的值作为输入，然后传递给python脚本，最后经过python的处理后，输出想要得到的字符串格式。

transform的基本语法为：

sql 复制代码

select transform(intput columns)
using 'python *.py'
as (output columns)

注意：在利用本地的python处理时，首先需要add file *.py;

参考文档
Hive的Transform和UDF
Hive------巧用transform处理复杂的字符串问题