Hive:transform和udf

工作中发现有时候会用到python脚本进行数据计算,但是现在貌似已经不这样再处理,一般使用封装好的udf函数。

transform的基本用法为:

transform中的值作为输入, 然后传递给python脚本,最后经过python的处理后,输出想要得到的字符串格式。

transform的基本语法为:

sql 复制代码
select transform(intput columns)
using 'python *.py'
as (output columns)

注意:在利用本地的python处理时,首先需要add file *.py;

参考文档
Hive的Transform和UDF
Hive------巧用transform处理复杂的字符串问题

相关推荐
云策数链9 小时前
ERP报表系统设计与数据仓库
数据仓库·erp·用友·云策数链
水火既济__13 小时前
加快hive效率
数据仓库·hive·hadoop
真上帝的左手1 天前
19. 大数据-数据仓库简介
大数据·数据仓库
lifewange2 天前
Hive 数据库 增删改 完整操作指南
数据库·hive·hadoop
WL_Aurora3 天前
Sqoop数据迁移工具从入门到精通
hive·hadoop·sqoop
zgdlsz3 天前
羲之文化传承人王杰宝:沉厚笔墨间的守正出新
大数据·数据库·数据仓库·涛思数据
莽撞的大地瓜3 天前
舆情分析智能体:蜜度新浪舆情通以多Agent协同驱动全流程智能升级
大数据·数据仓库·数据分析
小的~~4 天前
CentOS7安装CDH6.3.2
hive·hdfs·kafka
陆水A5 天前
用CASE WHEN实现横向迭代,节点数据串行推算
大数据·数据仓库·数据库开发·etl·etl工程师
承渊政道5 天前
从ROWNUM到LIMIT:KES、Oracle与PostgreSQL的执行顺序差异解析
数据库·数据仓库·sql·mysql·安全·postgresql·oracle