Doris Catalog

特性维度 Doris Catalog JDBC Catalog 说明
性能表现 大幅度领先 ,官方称最高可达200倍 性能受限于JDBC接口 Doris Catalog通过内部高效数据交换协议优化了性能瓶颈。
核心原理 使用内部二进制协议 依赖标准JDBC/ODBC协议 Doris Catalog避免了JDBC序列化/网络开销,实现向量化数据交换
查询覆盖 全面支持Doris所有数据类型与函数 受限于不同数据源JDBC驱动能力 确保了跨集群查询的语义一致性和功能完整性。
数据湖查询 原生高性能支持 (Hive, Iceberg, Hudi) 通常需要查询转换,性能有损 可直接作为统一数据湖查询入口。
使用场景 Doris多集群联邦查询、数据湖分析 连接各类支持JDBC的数据库 Doris Catalog专为Doris生态内高性能分析设计。

主要优势与价值

除了性能的飞跃,Doris Catalog还带来以下关键价值:

  • 实现真正的"高性能"跨集群查询:过去通过JDBC Catalog连接多个Doris集群时,查询延迟和吞吐量是瓶颈。Doris Catalog从根本上解决了这个问题,让跨集群查询像查询本地表一样高效。

  • 构建统一数据分析入口:用户可以通过一个Doris集群,无缝、高速地查询位于其他Doris集群、或Hive/Iceberg等数据湖中的表,简化了架构。

  • 开箱即用,易于管理 :创建Catalog的语法简单(CREATE CATALOG ... WITH DORIS),且可以通过SHOW CATALOGS等命令方便地进行管理。

如何使用与注意事项

  • 使用方法 :在Doris中执行类似下方的SQL命令即可创建(需使用Doris 2.1.0及以上版本):

    sql

    复制

    下载

    复制代码
    CREATE CATALOG doris_cluster PROPERTIES (
        "type"="doris",
        "doris.catalog.host"="目标集群FE主机",
        "doris.catalog.http_port"="目标集群FE http端口",
        "doris.catalog.user"="用户名",
        "doris.catalog.password"="密码"
    );
  • 注意事项

    1. 适用场景 :它主要优化了Doris集群之间的查询性能。如果需要连接MySQL、PostgreSQL等外部数据库,目前仍需使用JDBC Catalog。

    2. 权限与网络:需要确保当前集群能访问目标集群的FE节点,并具有相应的数据查询权限。

相关推荐
西岸行者4 天前
学习笔记:SKILLS 能帮助更好的vibe coding
笔记·学习
starlaky4 天前
Django入门笔记
笔记·django
勇气要爆发4 天前
吴恩达《LangChain LLM 应用开发精读笔记》1-Introduction_介绍
笔记·langchain·吴恩达
悠哉悠哉愿意4 天前
【单片机学习笔记】串口、超声波、NE555的同时使用
笔记·单片机·学习
勇气要爆发4 天前
吴恩达《LangChain LLM 应用开发精读笔记》2-Models, Prompts and Parsers 模型、提示和解析器
android·笔记·langchain
qianshanxue114 天前
计算机操作的一些笔记标题
笔记
土拨鼠烧电路4 天前
笔记11:数据中台:不是数据仓库,是业务能力复用的引擎
数据仓库·笔记
土拨鼠烧电路4 天前
笔记14:集成与架构:连接孤岛,构建敏捷响应能力
笔记·架构
烟花落o4 天前
栈和队列的知识点及代码
开发语言·数据结构·笔记·栈和队列·编程学习