基于流计算 Oceanus(Flink) CDC 做好数据集成场景

由于第一次做实时,所以踩坑比较多,见谅(测试环境用的flink),小公司没有用到hadoop组件

一、踩坑记录

1:本地代码的flink版本是flink1.15.4,生产环境是flink1.16.1,在使用侧输出流时报错,需要使用以下写法,需要使用SideOutputDataStream不能用DataStream,同时将pom下的flink版本切换为1.16.1

java 复制代码
SideOutputDataStream<String> tblHotelGuestSnapStreamDS = processedDS.getSideOutput(tblHotelGuestSnaptag);

2: Oceanus环境运行flink时候会默认使用RocksDB State Backend,不需要再手动配置检查点

3:可以利用checkpoint检查点来保证数据的端到端一致

4:打包可以使用maven协助打包

5: bin/start-cluster.sh启动后测试环境的8081无法访问,需要修改flink-conf.yml的属性rest.bind-address: 0.0.0.0和rest.bind-port: 8081和rest.port: 8081,之后重启就可以访问

相关推荐
蓝田生玉12328 分钟前
qwen2.5论文阅读笔记
论文阅读·笔记
xw-busy-code2 小时前
抽象语法书学习笔记
笔记·学习·ast·抽象语法树
小羊羔heihei2 小时前
Python编程实战:12道趣味算法题
笔记·python·学习·其他·算法·学习方法·交友
鸽子一号3 小时前
c#笔记之接口和抽象类
笔记
小羊羔heihei3 小时前
Python列表操作全攻略
经验分享·笔记·python·学习·其他·交友
mo_alo4 小时前
Everything Claude Code 完全指南:给 Claude Code 装上涡轮增压【安装和使用超详细教程!!!】
笔记·embedding·ai编程·claude·ecc
kyq___4 小时前
环路稳定性补偿学习笔记
笔记·学习
CyrusCJA4 小时前
日语零基础每天学习笔记【11-20】
笔记·学习
oi..4 小时前
Flag入门—Flag在返回包中
网络·笔记·测试工具·安全·网络安全