| 特性维度 | Doris Catalog | JDBC Catalog | 说明 |
|---|---|---|---|
| 性能表现 | 大幅度领先 ,官方称最高可达200倍 | 性能受限于JDBC接口 | Doris Catalog通过内部高效数据交换协议优化了性能瓶颈。 |
| 核心原理 | 使用内部二进制协议 | 依赖标准JDBC/ODBC协议 | Doris Catalog避免了JDBC序列化/网络开销,实现向量化数据交换。 |
| 查询覆盖 | 全面支持Doris所有数据类型与函数 | 受限于不同数据源JDBC驱动能力 | 确保了跨集群查询的语义一致性和功能完整性。 |
| 数据湖查询 | 原生高性能支持 (Hive, Iceberg, Hudi) | 通常需要查询转换,性能有损 | 可直接作为统一数据湖查询入口。 |
| 使用场景 | Doris多集群联邦查询、数据湖分析 | 连接各类支持JDBC的数据库 | Doris Catalog专为Doris生态内高性能分析设计。 |
主要优势与价值
除了性能的飞跃,Doris Catalog还带来以下关键价值:
-
实现真正的"高性能"跨集群查询:过去通过JDBC Catalog连接多个Doris集群时,查询延迟和吞吐量是瓶颈。Doris Catalog从根本上解决了这个问题,让跨集群查询像查询本地表一样高效。
-
构建统一数据分析入口:用户可以通过一个Doris集群,无缝、高速地查询位于其他Doris集群、或Hive/Iceberg等数据湖中的表,简化了架构。
-
开箱即用,易于管理 :创建Catalog的语法简单(
CREATE CATALOG ... WITH DORIS),且可以通过SHOW CATALOGS等命令方便地进行管理。
如何使用与注意事项
-
使用方法 :在Doris中执行类似下方的SQL命令即可创建(需使用Doris 2.1.0及以上版本):
sql
复制
下载
CREATE CATALOG doris_cluster PROPERTIES ( "type"="doris", "doris.catalog.host"="目标集群FE主机", "doris.catalog.http_port"="目标集群FE http端口", "doris.catalog.user"="用户名", "doris.catalog.password"="密码" ); -
注意事项:
-
适用场景 :它主要优化了Doris集群之间的查询性能。如果需要连接MySQL、PostgreSQL等外部数据库,目前仍需使用JDBC Catalog。
-
权限与网络:需要确保当前集群能访问目标集群的FE节点,并具有相应的数据查询权限。
-