PostgreSql FDW 与 DBLINK 区别

PostgreSQL 的 FDW (Foreign Data Wrapper) 和 dblink 都是用于访问外部数据源的工具，但它们在设计理念、易用性、功能和性能上有着显著的区别。

简单来说，FDW 是现代、声明式、符合SQL标准的方法，旨在让外部数据源看起来就像本地表一样。而 dblink 是一个更古老、过程式的工具，更适合执行单次特定的跨库查询或操作。

下面我们从多个维度进行详细对比。

对比总结表

特性	FDW (Foreign Data Wrapper)	dblink
设计理念	声明式 (Declarative)。你定义外部服务器的结构，查询优化器会参与规划。	过程式 (Procedural)。你在函数中明确指定如何连接和获取数据。
SQL标准	遵循 SQL/MED (Management of External Data) 标准。	PostgreSQL 特有的扩展，非标准。
使用方式	创建外部服务器、用户映射和外部表。之后像普通表一样查询。	使用 dblink_connect 建立连接，然后在 dblink() 函数中编写SQL语句执行。
性能	通常更好。优化器可以将条件下推（Pushdown）到远程服务器执行（取决于FDW实现）。	通常较差。经常需要将整个远程表数据拉取到本地再进行过滤和处理。
功能完整性	更强大。支持 SELECT, INSERT, UPDATE, DELETE，甚至支持事务（取决于FDW实现）。	主要是查询。虽然也能执行UPDATE/INSERT，但语法非常复杂，事务管理也很麻烦。
易用性	高。一旦配置完成，对用户来说是透明的，查询体验与本地表无异。	低。需要在查询中嵌入连接信息或依赖预建连接，SQL语句冗长且难以维护。
适用场景	频繁访问外部数据，希望进行联合查询、JOIN操作，需要双向数据写入。	偶尔的、即席的(ad-hoc) 跨库查询，一次性的数据迁移或操作。
连接管理	连接由FDW内部管理，对用户不可见。	需要用户显式地建立和关闭持久连接。
生态系统	丰富。有大量针对不同数据源的FDW实现（MySQL, Oracle, MongoDB, CSV, Redis等）。	单一。仅用于PostgreSQL到PostgreSQL的连接。

详细解释与示例

1. FDW (Foreign Data Wrapper)

FDW 的核心思想是"数据虚拟化 "。你通过定义外部表来告诉PostgreSQL："这里有一张表，它的数据不在我这里，但你（PostgreSQL）要像管理本地表一样去管理它"。

工作流程：

使用 CREATE EXTENSION postgres_fdw; 安装扩展。
CREATE SERVER 定义外部服务器（地址、端口等）。
CREATE USER MAPPING 定义用户映射（远程数据库的登录凭据）。
CREATE FOREIGN TABLE 定义外部表（表结构必须与远程表匹配或为其子集）。

示例：查询远程服务器上的 employees 表

sql 复制代码

-- 配置阶段（通常只需一次）
CREATE EXTENSION IF NOT EXISTS postgres_fdw;

CREATE SERVER remote_server
    FOREIGN DATA WRAPPER postgres_fdw
    OPTIONS (host '192.168.1.100', dbname 'remote_db', port '5432');

CREATE USER MAPPING FOR current_user
    SERVER remote_server
    OPTIONS (user 'foo', password 'secret');

CREATE FOREIGN TABLE remote_employees (
    id INT,
    name VARCHAR(100),
    department_id INT
)
SERVER remote_server
OPTIONS (schema_name 'public', table_name 'employees');

-- 使用阶段：像普通表一样查询，甚至可以与本地表JOIN
SELECT e.name, d.local_department_name
FROM remote_employees e
JOIN local_departments d ON e.department_id = d.id
WHERE e.salary > 50000; -- 条件可能被下推到远程服务器执行！

优点：

透明访问：用户无需关心数据在哪。
优化器支持：支持谓词下推，仅传输需要的数据，大大提升性能。
支持写操作 ：可以直接对外部表进行 INSERT/UPDATE/DELETE。
标准兼容：未来兼容性和可移植性更好。

2. dblink

dblink 更像是一个"远程SQL执行器"。你建立一个到远程数据库的连接，然后通过这个连接发送一条SQL语句过去执行，并获取结果。

工作流程：

使用 CREATE EXTENSION dblink; 安装扩展。
使用 dblink_connect 建立一個命名连接（或使用一次性连接字符串）。
使用 SELECT * FROM dblink(...) 来执行查询并获取结果集。

示例：执行同样的查询

sql 复制代码

-- 建立持久连接（可选，也可以在查询中直接指定连接字符串）
SELECT dblink_connect('my_conn', 'dbname=remote_db host=192.168.1.100 user=foo password=secret');

-- 执行查询
SELECT *
FROM dblink(
    'my_conn', -- 连接名
    'SELECT id, name, department_id FROM public.employees WHERE salary > 50000' -- 远程SQL
) AS t(id INT, name VARCHAR(100), department_id INT); -- 必须本地定义结果集结构

-- 记得关闭连接
SELECT dblink_disconnect('my_conn');
或者使用一次性连接方式：

SELECT *
FROM dblink(
    'dbname=remote_db host=192.168.1.100 user=foo password=secret',
    'SELECT id, name, department_id FROM public.employees WHERE salary > 50000'
) AS t(id INT, name VARCHAR(100), department_id INT);

缺点：

SQL冗长：每次查询都要写完整的远程SQL。
必须定义列结构 ：在调用 dblink() 时必须指定返回的列名和类型，非常繁琐且容易出错。
性能陷阱 ：WHERE 子句是在本地执行的（除非你把它写在远程SQL里）。如果你写 SELECT * FROM dblink(...) WHERE salary > 50000，它会先把整个 employees 表拉取到本地再过滤，性能极差。
事务管理复杂：在跨库事务中保持一致性非常困难。

如何选择？

选择 FDW 如果：
- 你需要频繁、持续地访问外部数据。
- 你希望进行复杂的多表联接查询（尤其是外部表与本地表的联接）。
- 你希望对外部数据进行读写操作（而不仅仅是读取）。
- 你追求更好的查询性能和更简洁的SQL语法。
- 你连接的数据源种类繁多（如MySQL, MongoDB等），FDW有丰富的生态支持。
选择 dblink 如果：
- 你只是偶尔进行一次即席查询或数据检查。
- 你需要执行一次性的数据迁移或批量更新。
- 你的操作非常特殊，FDW的声明式模式无法满足（例如调用远程的存储过程）。
- 你使用的PostgreSQL版本非常老，不支持所需的FDW功能（但这种情况现在很少见）。

总结

特性	FDW	dblink
核心比喻	虚拟表	远程SQL管道
最佳用途	数据集成	即席查询

在现代PostgreSQL开发中，FDW 几乎是访问外部PostgreSQL或其他数据源的首选和推荐方案。除非你有非常特殊的、一次性的需求，否则都应该使用FDW来代替dblink。