Doris Catalog

特性维度 Doris Catalog JDBC Catalog 说明
性能表现 大幅度领先 ,官方称最高可达200倍 性能受限于JDBC接口 Doris Catalog通过内部高效数据交换协议优化了性能瓶颈。
核心原理 使用内部二进制协议 依赖标准JDBC/ODBC协议 Doris Catalog避免了JDBC序列化/网络开销,实现向量化数据交换
查询覆盖 全面支持Doris所有数据类型与函数 受限于不同数据源JDBC驱动能力 确保了跨集群查询的语义一致性和功能完整性。
数据湖查询 原生高性能支持 (Hive, Iceberg, Hudi) 通常需要查询转换,性能有损 可直接作为统一数据湖查询入口。
使用场景 Doris多集群联邦查询、数据湖分析 连接各类支持JDBC的数据库 Doris Catalog专为Doris生态内高性能分析设计。

主要优势与价值

除了性能的飞跃,Doris Catalog还带来以下关键价值:

  • 实现真正的"高性能"跨集群查询:过去通过JDBC Catalog连接多个Doris集群时,查询延迟和吞吐量是瓶颈。Doris Catalog从根本上解决了这个问题,让跨集群查询像查询本地表一样高效。

  • 构建统一数据分析入口:用户可以通过一个Doris集群,无缝、高速地查询位于其他Doris集群、或Hive/Iceberg等数据湖中的表,简化了架构。

  • 开箱即用,易于管理 :创建Catalog的语法简单(CREATE CATALOG ... WITH DORIS),且可以通过SHOW CATALOGS等命令方便地进行管理。

如何使用与注意事项

  • 使用方法 :在Doris中执行类似下方的SQL命令即可创建(需使用Doris 2.1.0及以上版本):

    sql

    复制

    下载

    复制代码
    CREATE CATALOG doris_cluster PROPERTIES (
        "type"="doris",
        "doris.catalog.host"="目标集群FE主机",
        "doris.catalog.http_port"="目标集群FE http端口",
        "doris.catalog.user"="用户名",
        "doris.catalog.password"="密码"
    );
  • 注意事项

    1. 适用场景 :它主要优化了Doris集群之间的查询性能。如果需要连接MySQL、PostgreSQL等外部数据库,目前仍需使用JDBC Catalog。

    2. 权限与网络:需要确保当前集群能访问目标集群的FE节点,并具有相应的数据查询权限。

相关推荐
驭渊的小故事7 小时前
简单模板笔记
数据结构·笔记·算法
智者知已应修善业8 小时前
【洛谷P9975奶牛被病毒传染最少数量推导,导出多样例】2025-2-26
c语言·c++·经验分享·笔记·算法·推荐算法
Junlan278 小时前
Cursor使用入门及连接服务器方法(更新中)
服务器·人工智能·笔记
risc1234569 小时前
如何认识结构?结构 = 要素 + 关系 + 动态
笔记
風清掦9 小时前
【江科大STM32学习笔记-05】EXTI外部中断11
笔记·stm32·学习
wdfk_prog9 小时前
[Linux]学习笔记系列 -- [drivers][tty]sysrq
linux·笔记·学习
QT.qtqtqtqtqt10 小时前
uni-app小程序前端开发笔记(更新中)
前端·笔记·小程序·uni-app
EmbedLinX10 小时前
嵌入式之协议解析
linux·网络·c++·笔记·学习
凉、介10 小时前
VMware 三种网络模式(桥接 / NAT / Host-Only)原理与实验解析
c语言·网络·笔记·操作系统·嵌入式·vmware
Aliex_git10 小时前
跨域请求笔记
前端·网络·笔记·学习