Apache DolphinScheduler支持Flink吗？

DolphinScheduler社区2024-05-03 18:20

随着大数据技术的快速发展，很多企业开始将Flink引入到生产环境中，以满足日益复杂的数据处理需求。而作为一款企业级的数据调度平台，Apache DolphinScheduler也跟上了时代步伐，推出了对Flink任务类型的支持。

Flink是一个开源的分布式流处理框架，具有高吞吐量、低延迟和准确性等特点，广泛应用于实时数据分析、机器学习等场景。通过DolphinScheduler的Flink任务类型，用户可以轻松地将Flink作业纳入到整个数据调度流程中，大大提高了数据处理的效率和可靠性。本文将介绍如何在DolphinScheduler中支持Flink节点，包括任务创建、设置等。

Flink节点

Flink 任务类型，用于执行 Flink 程序。对于 Flink 节点：

当程序类型为 Java、Scala 或 Python 时，worker 使用 Flink 命令提交任务 flink run。
当程序类型为 SQL 时，worker 使用sql-client.sh 提交任务。

创建任务

点击项目管理-项目名称-工作流定义，点击"创建工作流"按钮，进入 DAG 编辑页面；
拖动工具栏的任务节点到画板中。

任务参数

任务样例

执行 WordCount 程序

本案例为大数据生态中常见的入门案例，常应用于 MapReduce、Flink、Spark 等计算框架。主要为统计输入的文本中，相同的单词的数量有多少。

1.在 DolphinScheduler 中配置 Flink 环境

若生产环境中要是使用到 flink 任务类型，则需要先配置好所需的环境。配置文件如下：bin/env/dolphinscheduler_env.sh。

2.任务流程

上传主程序包

在使用 Flink 任务节点时，需要利用资源中心上传执行程序的 jar 包。

当配置完成资源中心之后，直接使用拖拽的方式，即可上传所需目标文件。

配置 Flink 节点

根据上述参数说明，配置所需的内容即可。

执行 FlinkSQL 程序

根据上述参数说明，配置所需的内容即可。

注意事项

Java 和 Scala 只是用来标识，没有区别，如果是 Python 开发的 Flink 则没有主函数的 class，其余的都一样。
使用 SQL 执行 Flink SQL 任务，目前只支持 Flink 1.13及以上版本。

原文链接：https://blog.csdn.net/zhengzaifeidelushang/article/details/136687233

本文由白鲸开源科技提供发布支持！

上一篇：【人工智能基础】逻辑回归实验分析

下一篇：Python语言在地球科学中地理、气象、气候变化、水文、生态、传感器等数据可视化到常见数据分析方法的使用

热门推荐

01BongoCat - 跨平台键盘猫动画工具 02GitHub 镜像站点 03两千字总结：Codex 国内如何安装和使用的教程，以及如何设置中文回答 04UV安装并设置国内源 05Linux下V2Ray安装配置指南 06KGG转MP3工具|非KGM文件|解密音频 07GitLab 零基础入门指南：从安装到项目管理全流程 08荣耀手机2025年10月发布的新品Magic8比起Magic7，在硬件、性能、价格等上有什么区别，有什么优势 09windows找不到gpedit.msc（本地组策略编辑器）10在VSCode配置Java开发环境的保姆级教程（适配各类AI编程IDE）