Apache Doris简介

1.Doris 概述

Apache Doris 由百度大数据部研发(之前叫百度 Palo,2018 年贡献到 Apache 社区后, 更名为 Doris ) ,在百度内部, 有超过 200 个产品线在使用, 部署机器超过 1000 台, 单一 业务最大可达到上百 TB。

Apache Doris 是一个现代化的 MPP (Massively Parallel Processing,即大规模并行处理) 分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。 Apache Doris 的分布式架构非常简洁,易于运维, 并且可以支持 10PB 以上的超大数据集。

Apache Doris 可以满足多种数据分析需求,例如固定历史报表,实时数据分析, 交互式

数据分析和探索式数据分析等。

2.Doris 架构

Doris 的架构很简洁, 只设 FE(Frontend)、BE(Backend)两种角色、两个进程, 不依赖于 外部组件, 方便部署和运维, FE 、BE 都可线性扩展。

⚫ FE (Frontend) :存储、维护集群元数据;负责接收、解析查询请求,规划查询计划,

调度查询执行, 返回查询结果。主要有三个角色:

(1)Leader 和 Follower:主要是用来达到元数据的高可用,保证单节点宕机的情况下, 元数据能够实时地在线恢复,而不影响整个服务。

(2) Observer:用来扩展查询节点,同时起到元数据备份的作用。如果在发现集群压力 非常大的情况下,需要去扩展整个查询的能力,那么可以加 observer 的节点。observer 不 参与任何的写入,只参与读取。

⚫ BE (Backend) :负责物理数据的存储和计算;依据 FE 生成的物理计划, 分布式地执行查询。

数据的可靠性由 BE 保证,BE 会对整个数据存储多副本或者是三副本。副本数可根据 需求动态调整。

⚫ MySQL Client

Doris 借助 MySQL 协议,用户使用任意 MySQL 的 ODBC/JDBC 以及 MySQL 的客户 端,都可以直接访问 Doris。

⚫ Broker

Broker 为一个独立的无状态进程。封装了文件系统接口, 提供 Doris 读取远端存储系统 中文件的能力, 包括 HDFS ,S3 ,BOS 等。

参考文章:https://blog.csdn.net/xianyu120/article/details/132132619

相关推荐
小村儿9 分钟前
连载13- 内部Tools,Claude Code 怎么真正"动"你的代码
前端·后端·ai编程
IT_陈寒10 分钟前
Python的线程池把我坑惨了,原来异步不是万能的
前端·人工智能·后端
郑洁文16 分钟前
基于SpringBoot的商品仓库管理系统的设计与实现
java·spring boot·后端·仓库管理系统·商品仓库管理系统
该用户已不存在41 分钟前
这9款开发工具夯爆了,用了都说好
后端·程序员·全栈
KeepPush42 分钟前
Python迭代器与生成器:从原理到实战的深度解析
后端
我不介意孤独44 分钟前
04-记忆系统为什么向量数据库不够用
数据库·人工智能·资源隔离·agent infra
KeepPush1 小时前
Python itertools 深度指南:用迭代器代数写出更高效的代码
后端
AOwhisky1 小时前
MySQL 学习笔记(第六期):MySQL 备份与恢复
运维·数据库·笔记·学习·mysql·云计算
qq21084629532 小时前
【数据库】TDengine 清理旧数据
数据库·oracle·tdengine
j_xxx404_2 小时前
MySQL表操作硬核解析:从 CREATE TABLE 到磁盘文件、ALTER TABLE 与 DDL 风险
运维·服务器·数据库·c++·mysql·adb·ai