hive使用hplsql进行etl或其它数据加工

cyhysr2024-04-30 8:47

参照

https://cwiki.apache.org/confluence/pages/viewpage.action?pageId=59690156

http://www.hplsql.org/doc

Hive HPL/SQL，即Hive Hybrid Procedural SQL一个开源工具，它为hive实现了过程性的SQL功能，类似Oracle的PLSQL。从hive 2.0.0开始出现，自此hive的etl更便利。

hplsql命令位于路径$HIVE_HOME/bin/hplsql。

注意：该HPLSQL命令能被执行的前提是要执行 hive --service hiveserver2 启动hive

格式

语法：hplsql -e 'query'

hplsql -e 'select 1'

格式2

语法：hplsql -f 'file'

hplsql -f test.sql

上图用到的test.sql脚本文件，其内容如下所示

简单的etl示例

上一篇：探索PyTorch：开源深度学习框架的魅力

下一篇：paddle ocr模型量化实践

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？092026 年 AI 大模型 & AI 编程工具实战全总结 10微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新