Flink SQL Cookbook on Zeppelin 部署使用

简介:对于初学者来说,学习 Flink 可能不是一件容易的事情。看文档是一种学习,更重要的是实践起来。但对于一个初学者来说要把一个 Flink SQL 跑起来还真不容易,要搭各种环境,真心累。很幸运的是,Flink 生态圈里有这样一款工具可以帮助你更有效率地学习 Flink:Zeppelin。
相关类似文章较多,但相关依赖环境也给准备好的较少,故做此文。

1.准备环境

这个 repo 里是一些 Zeppelin notebook,里面都是 flink-SQL-cookbook 里的例子。

git下载:

powershell 复制代码
git clone https://github.com/zjffdu/flink-SQL-cookbook-on-zeppelin.git

csdn下载(免积分):flink-SQL-cookbook-on-zeppelin

下载好,放到"/home"下,如下图所示:

下载 Flink 1.12.1,已集成 flink-faker-0.2.0.jar(lib目录下)。

csdn下载(免积分):flink-SQL-cookbook-on-zeppelin

下载好,放到"/home"下,如下图所示:

1.3 docker运行

docker环境搭建,可参考:一键安装docker环境:docker、docker-compose

docker镜像如果不能在镜像仓库下载,可以到我的网盘下载:https://pan.baidu.com/s/17f0Vl2cd7gRIlOfP3wZ1xQ?pwd=mc2k

docker命令:

powershell 复制代码
docker run -d -p 8081:8081 -p 8080:8080 --rm -v $PWD/logs:/logs -v /home/flink-sql-cookbook-on-zeppelin-main/:/notebook -v /home/flink-1.12.1/:/flink -e ZEPPELIN_LOG_DIR='/logs' -e ZEPPELIN_NOTEBOOK_DIR='/notebook' --name zeppelin apache/zeppelin:0.9.0

2.1 访问

浏览器访问:http://ip:8080

2.2 flink配置

这是 Zeppelin 的 UI,里面已经有了一个文件夹 Flink SQL Cookbook,内含所有 Flink SQL 教程。首先我们需要配置下 Flink 解释器,点击右上角的菜单,选择 interpreter,找到 Flink interpreter,修改其中的 FLINK_HOME 为 /flink (也就是上面 docker 命令里我们挂载的 flink),然后点击重启 interpreter。


2.3 使用

启动:

当出现当前时间的模拟数据时,系统正常运行:

相关推荐
yumgpkpm9 小时前
CMP平台(类Cloudera CDP7.3)在华为鲲鹏的Aarch64信创环境中的性能表现
大数据·flink·kafka·big data·flume·cloudera
武子康10 小时前
大数据-124 - Flink State:Keyed State、Operator State KeyGroups 工作原理 案例解析
大数据·后端·flink
代码匠心1 天前
从零开始学Flink:流批一体的执行模式
java·大数据·后端·flink·大数据处理
鸿儒之观1 天前
dinky提交flink任务报 java.lang.OutOfMemoryError: Direct buffer memory
大数据·flink
武子康1 天前
大数据-123 - Flink 并行度设置优先级讲解 原理、配置与最佳实践 从Kafka到HDFS的案例分析
大数据·后端·flink
Hello.Reader2 天前
Flink 状态模式演进(State Schema Evolution)从原理到落地的一站式指南
python·flink·状态模式
武子康2 天前
大数据-122 - Flink Watermark 全面解析:事件时间窗口、乱序处理与迟到数据完整指南
大数据·后端·flink
Hello.Reader3 天前
Flink 状态后端(State Backends)实战原理、选型、配置与调优
大数据·flink
还是大剑师兰特3 天前
Flink面试题及详细答案100道(61-80)- 时间与窗口
flink·大剑师·flink面试题
武子康3 天前
大数据-121 - Flink 时间语义详解:EventTime、ProcessingTime、IngestionTime 与 Watermark机制全解析
大数据·后端·flink