基于流计算 Oceanus(Flink) CDC 做好数据集成场景

由于第一次做实时,所以踩坑比较多,见谅(测试环境用的flink),小公司没有用到hadoop组件

一、踩坑记录

1:本地代码的flink版本是flink1.15.4,生产环境是flink1.16.1,在使用侧输出流时报错,需要使用以下写法,需要使用SideOutputDataStream不能用DataStream,同时将pom下的flink版本切换为1.16.1

java 复制代码
SideOutputDataStream<String> tblHotelGuestSnapStreamDS = processedDS.getSideOutput(tblHotelGuestSnaptag);

2: Oceanus环境运行flink时候会默认使用RocksDB State Backend,不需要再手动配置检查点

3:可以利用checkpoint检查点来保证数据的端到端一致

4:打包可以使用maven协助打包

5: bin/start-cluster.sh启动后测试环境的8081无法访问,需要修改flink-conf.yml的属性rest.bind-address: 0.0.0.0和rest.bind-port: 8081和rest.port: 8081,之后重启就可以访问

相关推荐
StickToForever12 分钟前
第4章 信息系统架构(二)
经验分享·笔记·学习·职场和发展
阿噜噜小栈27 分钟前
Cursor 无限续杯
经验分享·笔记
omage3 小时前
cornerstone3D学习笔记-MPR
笔记·学习·vtk·dicom·mpr
Zhouqi_Hua5 小时前
LLM论文笔记 15: Transformers Can Achieve Length Generalization But Not Robustly
论文阅读·笔记·深度学习·语言模型·自然语言处理
Urf_read5 小时前
微服务入门-笔记
redis·笔记·微服务
V---scwantop---信6 小时前
英文字体:极简现代浓缩未来派科技海报标题排版无衬线字体 PODIUM Sharp Font
笔记·字体
出门喝奶茶7 小时前
挖掘图片的秘密:如何用piexif提取和修改Exif数据
笔记·python
Moonnnn.7 小时前
C语言——时基
c语言·笔记·学习
人有一心8 小时前
cs224w课程学习笔记-第2课
笔记·学习
红色的山茶花8 小时前
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-build.py
笔记·深度学习·yolo