在 PostgreSQL(PG)中,Subscription(订阅) 是逻辑复制中的一个概念,用于从 Publication(发布) 中接收数据变更。Subscription 允许一个数据库实例(订阅者)连接到另一个数据库实例(发布者)并接收表数据的增量更改。订阅者可以应用发布者的 INSERT
、UPDATE
、DELETE
以及 TRUNCATE
操作,从而保持两者数据的同步。
逻辑复制中的角色
- Publication(发布):由发布者数据库创建,定义哪些表或操作应该被发送给订阅者。
- Subscription(订阅):由订阅者数据库创建,用于连接到发布者并接收数据变更。
工作原理
- 在发布者数据库上创建一个 Publication,定义要发布的表和操作。
- 在订阅者数据库上创建一个 Subscription,连接到发布者并订阅所定义的 Publication。
- PostgreSQL 会先把发布者中指定表的现有数据同步到订阅者,然后继续将增量的数据变更实时传输到订阅者。
创建和管理 Subscriptions
1. 创建 Subscription
使用 CREATE SUBSCRIPTION
命令在订阅者数据库中创建一个订阅。订阅者通过连接字符串连接到发布者,指定要订阅的发布。
-
创建订阅,并且同步数据:
CREATE SUBSCRIPTION my_subscription CONNECTION 'host=remote_host dbname=remote_db user=remote_user password=remote_password' PUBLICATION my_publication;
CONNECTION
:用于连接发布者数据库的连接字符串。PUBLICATION
:指定要订阅的 Publication 名称。
2. 查看 Subscription
可以使用 \dRs+
命令或查询系统表 pg_subscription
来查看现有的订阅信息:
SELECT * FROM pg_subscription;
3. 删除 Subscription
使用 DROP SUBSCRIPTION
命令删除订阅。
DROP SUBSCRIPTION my_subscription;
4. 暂停或恢复 Subscription
使用 ALTER SUBSCRIPTION
命令可以暂停或恢复订阅,以控制是否接收发布者的数据变更。
-
暂停订阅:
ALTER SUBSCRIPTION my_subscription DISABLE;
-
恢复订阅:
ALTER SUBSCRIPTION my_subscription ENABLE;
Subscription 的选项
CREATE SUBSCRIPTION
语句中可以配置多种选项来控制如何同步数据:
copy_data
:默认情况下,订阅会在创建时同步表中的现有数据。可以通过WITH (copy_data = false)
来禁用这个行为,从而只接收增量变更。refresh
:当发布的结构发生变化时,订阅者可以刷新订阅,以确保表结构与发布者一致。synchronous_commit
:控制订阅的同步提交模式,用于调节复制过程中性能与数据一致性的平衡。
Subscription 应用场景
- 读写分离:通过订阅,主数据库发布数据变更,多个只读副本数据库订阅这些变更,以实现读写分离架构。主库承担写入操作,从库处理查询,减轻主库负载。
- 高可用性和灾难恢复:逻辑复制可以在不同的数据库实例之间同步数据,这对于实现高可用性和灾难恢复非常有帮助。
- 数据分发:通过逻辑复制,可以将数据从一个数据库发布到多个订阅者中,从而实现数据分发。
- 在线数据迁移:通过创建订阅,可以将一个数据库的数据迁移到另一个数据库,同时保持数据的增量同步,避免停机时间。
示例:主从同步
假设有一个发布者数据库和一个订阅者数据库,通过逻辑复制同步 my_table
表的数据。
-
在发布者数据库上创建 Publication:
CREATE PUBLICATION my_publication FOR TABLE my_table;
-
在订阅者数据库上创建 Subscription:
CREATE SUBSCRIPTION my_subscription CONNECTION 'host=publisher_host dbname=publisher_db user=publisher_user password=publisher_password' PUBLICATION my_publication;
-
订阅者会首先同步
my_table
中的数据,然后继续接收发布者的增量变更。
Subscription 与物理复制的区别
- 数据范围:逻辑复制通过 Publication 和 Subscription 可以选择性地复制某些表的数据,而物理复制则需要同步整个数据库实例的所有数据。
- 表结构灵活性:在逻辑复制中,发布者和订阅者的表结构可以不同,只要复制的列是相互兼容的;物理复制则要求主从库的结构完全一致。
- 数据库版本兼容性:逻辑复制可以跨不同版本的 PostgreSQL 实例复制数据,而物理复制要求主从库使用相同的 PostgreSQL 版本。
Subscription 的限制和注意事项
- 主键要求:为了确保增量数据变更能够在订阅者数据库上正确应用,逻辑复制的表通常需要有主键或唯一约束。
- 数据一致性:逻辑复制是异步的,因此订阅者数据库上的数据可能会稍微滞后于发布者,特别是在网络延迟或负载较高的情况下。
- 网络连接:订阅者需要持续连接到发布者以接收数据变更,因此网络稳定性会影响同步效率。
小结
Subscription 是 PostgreSQL 逻辑复制体系中的关键部分,通过订阅发布的数据变更,能够实现数据库之间的实时数据同步。结合 Publication,Subscription 提供了灵活的数据复制机制,适用于多种场景如读写分离、分布式数据管理和数据迁移等。