【Flink实战】Flink -C实现类路径配置与实现UDF Jar

文章目录

    • [1. 描述](#1. 描述)
    • [2. 使用语法](#2. 使用语法)
    • [3. `-C` 适用的 Flink 运行模式](#3. -C 适用的 Flink 运行模式)
    • [4. USING JAR 不可用](#4. USING JAR 不可用)

1. 描述

Flink 中的 -C 选项用于将 URL 添加到作业的类加载器中。URL可以指向本地、HTTP 服务器或 HDFS 等资源的Jar文件。

注意:

  1. 此处的classpath的url必须是一个能够在client,JM和TM都被访问到的位置。
  2. 此位置从client端的提交到JM的分发到TM的访问的过程中,不会发生文件移动的动作。
  3. url支持的协议包括file,ftp,gopher,http,https,jar,mailto,netdoc,亦即java中URL类支持的协议类型。
  4. 注意:不能放在hdfs上。否则会报错:Bad syntax for classpath: hdfs://xxx。

2. 使用语法

shell 复制代码
flink run \
  -C http://home/user/flink-udf1.jar \
  -C http://home/user/flink-udf2.jar \
  -j job.jar

配置多个udf: 每个 -C 选项只能对应一个 JAR ,不能用逗号 , 分隔多个路径。

如下示例,

从Taskmanager日志可以看到成功加载https格式的jar包

url路径的结尾可以不以.jar结尾

运行模式 是否支持 -C
Standalone(独立模式) ✅ 支持
YARN Session ✅ 支持
YARN Per-job ✅ 支持
Kubernetes ✅ 支持
Local(本地模式) ✅ 支持

4. USING JAR 不可用

使用Flink Sql加载udf

sql 复制代码
CREATE FUNCTION my_udf AS 'com.example.MyUDF' USING JAR 'hdfs://namenode:9000/flink-udf.jar';

报错:直接不可用。

log 复制代码
org.apache.flink.api.common.InvalidProgramException: Table program cannot be compiled. This is a bug. Please file an issue. at
相关推荐
孟意昶25 分钟前
Spark专题-第一部分:Spark 核心概述(1)-Spark 是什么?
大数据·分布式·spark
小花鱼202512 小时前
Elasticsearch (ES)相关
大数据·elasticsearch
TDengine (老段)13 小时前
TDengine 选择函数 TOP() 用户手册
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
mask哥14 小时前
详解mcp以及agen架构设计与实现
java·微服务·flink·大模型·ai agent·springai·mcp
Dobby_0514 小时前
【Hadoop】分布式文件系统 HDFS
大数据·hadoop·分布式
哈哈很哈哈14 小时前
Spark 核心 RDD详解
大数据·分布式·spark·scala
智海观潮14 小时前
Spark广播变量HttpBroadcast和TorrentBroadcast对比
大数据·spark
项目題供诗14 小时前
Hadoop(十一)
大数据·hadoop·分布式
青云交15 小时前
Java 大视界 -- Java 大数据在智能家居场景联动与用户行为模式挖掘中的应用
java·大数据·智能家居·边缘计算·户型适配·行为挖掘·场景联动
shinelord明15 小时前
【数据行业发展】可信数据空间~数据价值的新型基础设施
大数据·架构·云计算·创业创新