基于流计算 Oceanus(Flink) CDC 做好数据集成场景

由于第一次做实时,所以踩坑比较多,见谅(测试环境用的flink),小公司没有用到hadoop组件

一、踩坑记录

1:本地代码的flink版本是flink1.15.4,生产环境是flink1.16.1,在使用侧输出流时报错,需要使用以下写法,需要使用SideOutputDataStream不能用DataStream,同时将pom下的flink版本切换为1.16.1

java 复制代码
SideOutputDataStream<String> tblHotelGuestSnapStreamDS = processedDS.getSideOutput(tblHotelGuestSnaptag);

2: Oceanus环境运行flink时候会默认使用RocksDB State Backend,不需要再手动配置检查点

3:可以利用checkpoint检查点来保证数据的端到端一致

4:打包可以使用maven协助打包

5: bin/start-cluster.sh启动后测试环境的8081无法访问,需要修改flink-conf.yml的属性rest.bind-address: 0.0.0.0和rest.bind-port: 8081和rest.port: 8081,之后重启就可以访问

相关推荐
好望角雾眠4 小时前
第一阶段C#基础-10:集合(Arraylist,list,Dictionary等)
笔记·学习·c#
yatingliu20197 小时前
HiveQL | 个人学习笔记
hive·笔记·sql·学习
郭庆汝7 小时前
CMake概述用法详细笔记
笔记
张人玉7 小时前
XML 序列化与操作详解笔记
xml·前端·笔记
风和日丽 随波逐流7 小时前
java17学习笔记-Deprecate the Applet API for Removal
笔记·学习
淮北也生橘127 小时前
Linux的ALSA音频框架学习笔记
linux·笔记·学习
yiqiqukanhaiba10 小时前
STM32学习笔记13-通信协议I2C&MPU6050&I2C软件控制
笔记·stm32·学习
code bean10 小时前
【halcon】Halcon 开发笔记: gray_histo_abs 报错陷阱
笔记
Warren9811 小时前
软件测试-Selenium学习笔记
java·javascript·笔记·学习·selenium·测试工具·安全
山烛15 小时前
矿物分类系统开发笔记(二):模型训练[删除空缺行]
人工智能·笔记·python·机器学习·分类·数据挖掘