Flink学习4 - 富函数 + 数据重分区操作 + sink 操作(kafka、redis、jdbc)

1、富函数 - 函数类接口,可以获取运行环境的上下文,实现更复杂的功能


2、数据重分区操作


3、sink操作

sink - kafka

1、引入kafka的pom依赖

bash 复制代码
<dependency>
	<groupId>org.apache.flink</groupId>
<!--<artifactId>flink-connector-kafka_${scala.binary.version}</artifactId>-->
<!--<version>${flink.version}</version>-->
	<artifactId>flink-connector-kafka-0.11_2.12</artifactId>
	<version>1.10.1</version>
</dependency>

2.启动 zookeeper

bash 复制代码
$ bin/zookeeper-server-start.sh config/zookeeper.properties

3.启动 kafka 服务

bash 复制代码
$ bin/kafka-server-start.sh config/server.properties

4.启动 kafka 生产者

bash 复制代码
$ bin/kafka-console-profucer.sh --broker-list localhost:9092 --topic sensor

5.运行 Flink 程序,在 kafka 生产者输入数据,查看 kafka 消费者的输出结果

![在这里插入图

sink - redis

1、添加 pom 依赖

2、 java代码


3、启动 redis

bash 复制代码
redis-server..exe redis.windows.conf

原来的不要关闭,启动另一个窗口

bash 复制代码
redis-cli.exe -h 127.0.0.1 -p 6379

4、运行程序,进行查询

sink-JDBC自定义sink-mysql

1.pom依赖



错误

1 启动 zookeeper,却无法启动 kafka

原因:kafka 日志被异常清理导致进程频繁挂掉

linux 会定时清理 /tmp 目录下的文件, kafka 日志文件目录正是放在了 /tmp/kafka-logs目录下,导致被定时给清理掉了,所以 kafka 在尝试读取或追加日志时就会出错。

修改:配置文件中的log.dirs

bash 复制代码
vi ./config/server.properties

重启kafka

2 另一个程序正在使用此文件,进程无法访问

原因:该问题是因为在关闭启动命令窗口时,直接点击右上角的×号关闭,下次启动就会出现该问题。

正确的关闭窗口方法:在启动窗口按ctrl+C

输入字母---Y则可成功关闭。需要注意的是该选择可能需要等待一会。这样子关闭窗口下次就可以正常启动了。

3由于 window 自带的 linux 子系统,由于是个 mini 的系统,没有其他功能,也无法下载软件 ,因此 windows 版本的 redis,在 window 中的 cmd 中测试

相关推荐
纪莫4 小时前
Kafka如何保证「消息不丢失」,「顺序传输」,「不重复消费」,以及为什么会发送重平衡(reblanace)
kafka
好望角雾眠4 小时前
第一阶段C#基础-10:集合(Arraylist,list,Dictionary等)
笔记·学习·c#
艾伦~耶格尔5 小时前
【集合框架LinkedList底层添加元素机制】
java·开发语言·学习·面试
星仔编程5 小时前
python学习DAY46打卡
学习
最初的↘那颗心5 小时前
Flink Stream API 源码走读 - print()
java·大数据·hadoop·flink·实时计算
大霞上仙5 小时前
实现自学习系统,输入excel文件,能学习后进行相应回答
python·学习·excel
.Shu.6 小时前
Redis Reactor 模型详解【基本架构、事件循环机制、结合源码详细追踪读写请求从客户端连接到命令执行的完整流程】
数据库·redis·架构
yatingliu20197 小时前
HiveQL | 个人学习笔记
hive·笔记·sql·学习
武当豆豆7 小时前
C++编程学习(第25天)
开发语言·c++·学习
风和日丽 随波逐流7 小时前
java17学习笔记-Deprecate the Applet API for Removal
笔记·学习