doris

鹿衔`3 天前
apache·doris·paimon
Apache Doris 2.1.10 集群部署与 Paimon 数据湖集成实战文档目录1. 环境概述1.1 硬件与系统信息1.2 节点规划1.3 依赖组件 (CDH)2. 基础环境准备 (所有节点)
鹿衔`3 天前
flink·apache·doris·paimon
Apache Doris 4.0.1 集群部署与 Paimon 数据湖集成实战文档目录1. 架构规划1.1 硬件与系统信息1.2节点分配1.3 依赖组件 (CDH)2. 操作系统基础配置 (所有节点)
想ai抽6 天前
starrocks·doris·数据湖
StarRocks PB 级日增量数据模型优化:注意点、调优策略与风险防控StarRocks 处理每日 PB 级日增量时,核心矛盾是「高吞吐导入」与「低延迟查询」的平衡,需从 数据模型设计、导入链路、存储查询、资源调度、稳定性保障 五维度系统性优化,同时规避增量场景下的典型风险。以下是具体细节:
孟意昶9 天前
大数据·数据库·分布式·sql·mysql·doris
Doris专题27-mysql兼容性与join连接Apache Doris高度兼容MySQL协议和语法,但存在一些重要差异。理解这些差异对于从MySQL迁移到Doris或进行混合部署至关重要。
FeelTouch Labs15 天前
doris
图解Apache Dorishttps://zhuanlan.zhihu.com/p/1891190981002495544Apache Doris × AI
最笨的羊羊18 天前
doris·flink cdc系列·schemautils·模式工具类
Flink CDC系列之:Doris 模式工具类DorisSchemaUtils这是一个 Doris 模式工具类,专门用于处理 Flink CDC 到 Doris 数据同步时的自动分区配置。
最笨的羊羊19 天前
doris·flink cdc系列·数据接收器工厂类·datasinkfactory
Flink CDC系列之:数据接收器工厂类DorisDataSinkFactory这是一个实现了 DataSinkFactory 接口的工厂类,专门用于创建 Doris 数据库的数据接收器。
Faith_xzc1 个月前
大数据·性能优化·doris
Doris内存问题指南:监控、原理与高频OOM解决方案做Doris运维或开发的同学,多少都踩过内存的坑:BE突然OOM、导入时内存暴涨、查询报“内存不足”…明明配置看着没问题,问题却反复出现?
piepis1 个月前
数据仓库·docker·doris·容器部署
Doris Docker 完整部署指南目前在网上没找到一个好用的doris 本地安装教程,参考官网的教程,写了一docker版本,基于mac版本的
涤生大数据1 个月前
大数据·spark·doris·实时计算·大数据开发·实时分析·实时技术
日均亿级数据的实时分析:Doris如何接过Spark的接力棒?过去十年,若要在大数据技术圈评选 “现象级顶流”,Apache Spark 必然是绕不开的存在。它曾以 “颠覆者” 姿态打破 Hadoop MapReduce 的桎梏,成为企业搭建数据体系的 “标配引擎”—— 从 TB 级离线数仓的批处理,到日均亿级数据的 ETL 清洗,再到早期机器学习模型的训练,Spark 几乎承包了大数据领域的半壁江山。 然而,随着数据需求的演进,企业从 “离线批量” 逐渐迈向 “实时交互” 与 “一体化分析”,新的技术浪潮正在兴起。以 Apache Doris 为代表的新一代引擎(
FeelTouch Labs2 个月前
doris
Apache Doris 与 湖仓一体Apache Doris 是一款基于 MPP 架构的高性能、实时的分析型数据库,以高效、简单、统一的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足报表分析、即席查询、统一数仓构建、湖仓一体等使用场景,用户可以在此之上构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。
孟意昶2 个月前
大数据·数据库·分布式·sql·doris
Doris专题17- 数据导入-文件格式Apache Doris 支持多种文件格式的数据导入,每种格式都有其特定的使用场景和配置参数。本笔记详细记录了 ORC、Parquet、JSON 和 CSV 格式的导入方法和最佳实践。
boonya3 个月前
apache·doris
Apache Doris 入门与技术替代方案Apache Doris 是一个基于 MPP 的实时数据仓库,以其极快的查询速度而闻名。对于大型数据集的查询,它可以在亚秒级返回结果。它既支持高并发的点查询,也支持高吞吐量的复杂分析。它可用于报表分析、即席查询、统一数据仓库和数据湖查询加速。基于 Apache Doris,用户可以构建用于用户行为分析、A/B 测试平台、日志分析、用户画像分析和电商订单分析的应用程序。
涤生大数据3 个月前
性能优化·apache·doris·大数据技术
Apache Doris性能优化全解析:慢查询定位与引擎深度调优在海量数据与复杂查询场景下,Apache Doris 的性能有时候并不能达到预期,这时候就需要通过系统性调优匹配业务需求。本文将梳理从问题定位到引擎优化的全流程方法,帮助开发者精准挖掘系统性能潜能。
BullSmall3 个月前
数据库·doris
Doris数据库-初识您想详细了解 Doris 数据库。下面的内容将全面介绍 Apache Doris,包括它是什么、为什么如此受欢迎、它的核心特性、架构以及典型使用场景。
cg.family3 个月前
doris
基于 Apache Doris 的用户画像数据模型设计方案数据源:用户基本信息:用户ID、性别、出生日期、注册时间、常驻地域(省、市、区)、职业等。用户体检报告:每次体检的报告ID、体检时间、各项指标(如血压、血糖、血脂、BMI等)。
cg.family3 个月前
kafka·doris
Doris 消费kafka消息Doris 通过 Routine Load 功能来消费 Kafka 消息,这是一种自动化的、持续的数据导入方式。
cg.family3 个月前
数据仓库·doris
Doris 数据仓库例子基于 Apache Doris 构建数据仓库的方案和具体例子。Doris 以其高性能、易用性和实时能力,成为构建现代化数据仓库(特别是 OLAP 场景)的优秀选择。
cg.family3 个月前
doris·routine load
Doirs Routine Load本文来深入、详细地介绍一下 Apache Doris 的 Routine Load 功能。这是 Doris 中实现持续、自动化数据导入的核心特性,尤其适用于从 Kafka 等消息系统中实时摄取数据。
SelectDB技术团队4 个月前
开源·apache·数据库开发·doris·实时分析
ApacheCon Asia 2025 中国开源年度报告:Apache Doris 国内第一上周刚落下帷幕的 ApacheCon Asia 2025 中,一个数据让所有人都为之震撼:全球 Apache 基金会项目 OpenRank 排行榜中,Apache Doris 位居第二,在中国 Apache 项目中更是稳居第一。