Flink SQL 的 JAR 语句ADD JAR / SHOW JARS / REMOVE JAR(SQL CLI 实战 + 避坑指南)

1. JAR 语句是干什么的?

官方定义:

JAR 语句用于在运行时把用户 jar 加入 classpath、从 classpath 移除,或查看已经添加的 jar。

它们主要面向 SQL CLI 的交互式会话使用。

2. SQL CLI 示例:三连击(ADD → SHOW → REMOVE)

2.1 添加本地 jar

sql 复制代码
Flink SQL> ADD JAR '/path/hello.jar';
[INFO] Execute statement succeeded.

2.2 添加远程 jar(例如 HDFS)

sql 复制代码
Flink SQL> ADD JAR 'hdfs:///udf/common-udf.jar';
[INFO] Execute statement succeeded.

2.3 查看已添加 jar

sql 复制代码
Flink SQL> SHOW JARS;
+----------------------------+
|                       jars |
+----------------------------+
|            /path/hello.jar |
| hdfs:///udf/common-udf.jar |
+----------------------------+

2.4 移除 jar

sql 复制代码
Flink SQL> REMOVE JAR '/path/hello.jar';
[INFO] The specified jar is removed from session classloader.

3. ADD JAR:语法与能力

3.1 语法

sql 复制代码
ADD JAR '<path_to_filename>.jar'

3.2 能力说明

  • 将指定 jar 加入资源列表(会话 classpath)
  • 支持 本地文件系统远程文件系统路径
  • 加完后可通过 SHOW JARS 查看

4. 重要限制:不要用 ADD JAR 去加载 Hive 相关(避坑必读)

官方限制(非常关键):

不要使用 ADD JAR 来加载 Hive source/sink/function/catalog。

这是 Hive connector 的已知限制,未来版本会修复。当前推荐按官方 Hive 集成指引进行 Hive 集成。

这句话的含义是:

即便你把 Hive 相关依赖 jar "塞进" classpath,也可能出现各种奇怪问题(类冲突、发现不到、行为不一致等)。Hive 集成通常要走更"规范"的方式(例如按官方集成步骤配置 Hive 相关依赖与模块/目录结构)。

5. SHOW JARS:查看当前会话 jar 列表

5.1 语法

sql 复制代码
SHOW JARS

5.2 作用

列出所有通过 ADD JAR 添加的 jar。

适用场景:

  • 确认 jar 是否加成功(路径是否正确)
  • 排查"类找不到 / UDF 找不到"时确认环境
  • 会话复用时确认是否被别人加过 jar(避免污染)

6. REMOVE JAR:移除指定 jar(仅 SQL CLI)

6.1 语法

sql 复制代码
REMOVE JAR '<path_to_filename>.jar'

6.2 说明

  • 移除指定的、由 ADD JAR 添加的 jar
  • 注意:REMOVE JAR 只在 SQL CLI 中生效(官方强调)

适用场景:

  • 临时调试用 jar,用完清理
  • 发生依赖冲突,移除某个 jar 做 A/B 验证
  • 会话长期复用,防止 jar 越加越多导致不可控

7. 一套实战工作流:用 JAR 语句管理 UDF

你在 SQL CLI 里注册 UDF 的常见节奏一般是:

1)添加 jar(本地或远程)

sql 复制代码
ADD JAR '/path/my-udf.jar';

2)确认 jar 已加载

sql 复制代码
SHOW JARS;

3)创建函数(示意)

sql 复制代码
CREATE FUNCTION my_func AS 'com.example.MyFunc';

4)验证函数可用

sql 复制代码
SHOW USER FUNCTIONS;
SELECT my_func(col) FROM t;

5)调试结束清理

sql 复制代码
REMOVE JAR '/path/my-udf.jar';

这套流程的价值:可控、可复现、可回滚。

8. 总结

  • Flink SQL 目前支持三种 JAR 语句:ADD JARSHOW JARSREMOVE JAR
  • 核心作用:管理 SQL CLI 会话 classloader 中的用户 jar
  • ADD JAR 支持本地/远程文件系统路径
  • 重要限制 :不要用 ADD JAR 加载 Hive source/sink/function/catalog(Hive connector 已知限制)
  • REMOVE JAR 仅在 SQL CLI 生效
相关推荐
常常有13 小时前
MySQL 底层执行原理:输入SQL语句到两阶段提交
数据库·sql·mysql
海市公约14 小时前
一条SQL查询的完整旅程:MySQL执行流程深度解析
sql·mysql·数据库优化·执行计划·连接器·查询缓存·sql执行原理
这个DBA有点耶15 小时前
COUNT进阶:超大表的近似计数与HyperLogLog
数据库·sql·程序人生·学习方法·dba·改行学it
清平乐的技术专栏15 小时前
【Flink学习】(五)Flink 并行度与任务链,任务运行核心原理
flink
淘矿人19 小时前
【AI大模型】AI 大模型推理平台完整测评:8 家主流聚合服务对比分析
人工智能·sql·gpt·学习·github·php
清平乐的技术专栏20 小时前
【Flink学习】(六)Flink 三大时间语义 + 水位线 Watermark
大数据·学习·flink
清平乐的技术专栏20 小时前
【Flink学习】(一)初识 Flink,大数据实时计算核心认知
大数据·flink
宋浮檀s21 小时前
SQL注入基础+DVWA搭建
数据库·sql·安全·网络安全
Amarantine、沐风倩✨21 小时前
Oracle 性能排查:通过 V$LONG_EXEC_SQLS 快速定位慢 SQL
数据库·sql·oracle
倔强的石头10621 小时前
生产环境排坑实录:SQL 标量子查询的“静默杀手”与优化器的智能推演
数据库·sql