1、业务背景

上一篇文章中，我们介绍了如何利用streamsets的组件实时采集https接口数据并入库的实现方案，本文我们将继续探讨streamsets的Mysql Binlog组件实现数据实时同步的强大功能。

日常开发中，我们经常会遇到数据同步的问题，比如两个不同的数据库实现数据的增量同步问题，对某张表的数据实时同步到另一个库的相同表；或者库中表的数据变更实时同步到redis中间件或者es( elasticsearch)服务，实现数据的实时同步，以便redis或es服务的数据不需要一行代码实现和数据库的实时同步等。

其实以上两种情况，对于库与库之间的数据同步，通过开启Mysql Binlog日志，加上一些中间件，比如阿里巴巴开源的的Canal增量订阅和消费组件也可以实现数据库的同步；另外对于和redis、es服务的同步问题，我们可以通过业务代码的形式，当数据变更时，同时更新数据到redis或者es服务，抑或通过消息中间件的发布订阅模式，通过监听方法，实现redis和es的数据同步。但是该方案一方面可能增加业务耦合或者需要编码方可实现，但是通过streamsets可以不用写一行业务代码实现数据同步的过程。

本文介绍下库与库之间的数据同步，下篇文章介绍下库与消息中间件之间的同步问题。