hive使用hplsql进行etl或其它数据加工

参照

https://cwiki.apache.org/confluence/pages/viewpage.action?pageId=59690156

http://www.hplsql.org/doc

Hive HPL/SQL,即Hive Hybrid Procedural SQL一个开源工具,它为hive实现了过程性的SQL功能,类似Oracle的PLSQL。从hive 2.0.0开始出现,自此hive的etl更便利。

hplsql命令位于路径$HIVE_HOME/bin/hplsql。

注意:该HPLSQL命令能被执行的前提是要执行 hive --service hiveserver2 启动hive

格式

语法:hplsql -e 'query'

hplsql -e 'select 1'

格式2

语法:hplsql -f 'file'

hplsql -f test.sql

上图用到的test.sql脚本文件,其内容如下所示

简单的etl示例

相关推荐
大数据深度洞察9 分钟前
Hive企业级调优[2]—— 测试用表
数据仓库·hive·hadoop
lzhlizihang12 分钟前
使用sqoop将mysql数据导入到hive报错ClassNotFoundException、Zero date value prohibited等错误
hive·报错·sqoop
goTsHgo14 分钟前
Hive自定义函数——简单使用
大数据·hive·hadoop
江畔独步5 小时前
Hive内置集合函数-size,map_keys,map_values,sort_array,array_contains
数据仓库·hive·hadoop
天地风雷水火山泽5 小时前
二百六十五、Hive——目前Hive数仓各层表样例
数据仓库·hive·hadoop
棉花糖灬5 小时前
Hive常用函数
数据仓库·hive·hadoop
zhangjin12221 天前
kettle从入门到精通 第八十五课 ETL之kettle kettle中javascript步骤调用外部javascript/js文件
javascript·数据仓库·etl·kettle调用外部js
nvd111 天前
Java ETL - Apache Beam 简介
java·apache·etl
mizuhokaga1 天前
Hive parquet表通过csv文件导入数据
数据仓库·hive·hadoop