flink cdc初始全量速度很慢原因和优化点

linweidong2023-08-28 16:06

link cdc初始全量速度很慢的原因之一是，它需要先读取所有的数据，然后再写入到目标端，这样可以保证数据的一致性和顺序。但是这样也会导致数据的延迟和资源的浪费。
flink cdc初始全量速度很慢的原因之二是，它使用了Debezium作为捕获数据变化的引擎，而Debezium在读取数据时，会使用全局锁或者快照隔离级别，这样会影响源端数据库的性能和并发能力。
flink cdc初始全量速度很慢的优化点之一是，使用并行读取的方式，将源端数据库的表分成多个分区，然后使用多个任务同时读取不同的分区，这样可以提高读取速度和吞吐量。
flink cdc初始全量速度很慢的优化点之二是，使用增量检查点的方式，将读取到的数据在内存中进行增量备份，然后定期写入到目标端，这样可以减少写入次数和延迟，并且在故障恢复时，可以从检查点恢复数据，而不需要重新读取所有的数据。
flink cdc初始全量速度很慢的优化点之三是，调整flink cdc和flink的相关参数和选项，如设置合理的并行度、任务槽、检查点间隔、缓冲区大小、网络超时等，以适应不同的场景和需求。