starrocks

镜舟科技1 天前
starrocks·数据分析·开源·数字化转型·华为鲲鹏·lakehouse·镜舟科技
活动回顾 | 镜舟科技出席鲲鹏开发者创享日・北京站12月12日,由华为技术有限公司主办的“鲲鹏开发者创享日・北京站”在北京圆满落幕。作为中国领先的企业级数据基础设施服务商,镜舟科技受邀出席,并亮相“开发者解决方案展区”,与现场顶尖技术大咖、科研领袖及行业伙伴共同探讨前沿科技,展示了新一代数据架构的无限可能。
鹿衔`5 天前
starrocks·apache·paimon
StarRocks 2.5.22 混合部署实战文档(CDH环境)目录1. 项目背景与环境节点分配2. 核心规划 (避坑关键)2.1 端口规划表2.2 目录规划3. 部署前置准备 (nd11, nd12, nd13)
StarRocks_labs6 天前
数据库·starrocks·compaction·memtable·本地磁盘 spill
从小文件困局到“花小钱办大事”:StarRocks 存算分离批量导入优化实践作者:罗一鑫 StarRocks Committer导读:在存算分离架构下,“一次性导入海量历史数据”正成为被放大的隐形风险。本文介绍 StarRocks 如何从写入源头重构大导入路径:通过“内存→本地磁盘 spill→集中 merge→对象存储”,减少远程写入和重复开销,降低 S3 写入次数并放大文件粒度,释放本地 I/O 能力,从源头缓解小文件问题,帮助用户以更低投入获得更高效、更稳定的使用体验。
想ai抽9 天前
starrocks·doris·数据湖
StarRocks PB 级日增量数据模型优化:注意点、调优策略与风险防控StarRocks 处理每日 PB 级日增量时,核心矛盾是「高吞吐导入」与「低延迟查询」的平衡,需从 数据模型设计、导入链路、存储查询、资源调度、稳定性保障 五维度系统性优化,同时规避增量场景下的典型风险。以下是具体细节:
杰克逊的日记2 个月前
starrocks·数据仓库·mpp
StarRocks数据仓库StarRocks 是一款 高性能、实时分析型数据库(OLAP),由字节跳动开源(2020 年开源,2023 年进入 Apache 孵化器),核心定位是 “实时数仓 + 湖仓一体”,专为 PB 级数据的快速查询、多维分析、实时报表等场景设计,广泛应用于互联网、金融、零售、政务等行业。
StarRocks_labs2 个月前
starrocks·人工智能·json·数据湖·存算分离
StarRocks 4.0:Real-Time Intelligence on Lakehouse回顾 StarRocks 的进化之路,每一次大版本迭代都紧扣时代对数据分析的核心诉求。StarRocks 1.x,打造极速查询性能,解决 BI 报表、数据探寻慢的痛点问题。
StarRocks_labs2 个月前
大数据·数据库·starrocks·hadoop·存算分离
告别 Hadoop,拥抱 StarRocks!政采云数据平台升级之路作者:李进勇 政采云研发中心数据平台负责人导读:在当下数字化转型的浪潮中,数据早已从辅助资源跃升为核心生产资料和决策基础。政府提升治理效能,企业优化运营、创新服务,都深度依赖对海量数据的实时洞察与高效处理。
StarRocks_labs2 个月前
数据库·starrocks·json·存算分离·olap 技术栈
StarRocks 在 Cisco Webex 的探索与实践作者:白旭:Cisco Software Engineer, Apache Amoro PPMC member
StarRocks_labs2 个月前
starrocks·connect 2025
StarRocks Community Monthly Newsletter (Sep)v3.5.6功能增强:当 Vacuum 成功时会更新 Vacuum 指标。在 Fragment 实例执行状态报告中新增线程池指标,包括活动线程数、队列数量和运行线程数。
码以致用2 个月前
数据库·starrocks·olap·1024程序员节
StarRocks笔记StarRocks 是新一代极速统一的云原生MPP数据库。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户无需经过复杂的预处理,就可以用 StarRocks 来支持多种数据分析场景的极速分析。
MARSERERER2 个月前
starrocks·clickhouse
ClickHouse迁移Starrocks脚本工具使用方法:执行sh process_inspect_event_dist.sh先导出ClickHouse数据至CSV文件:
StarRocks_labs2 个月前
starrocks·kubernetes·数据备份·存算一体架构·快照恢复机制
Kubernetes 场景下的 StarRocks 灾备体系:Cluster Snapshot 实践解析在存算一体架构下,StarRocks 通过 Failover Group、Backup & Restore 以及 Insert Into Files 等机制,实现了集群级的灾备与数据的备份和恢复能力。伴随性能优化与功能演进的持续推进,StarRocks 不断强化系统的稳定性与可用性,以满足企业日益增长的实时分析与高可用需求。
StarRocks_labs2 个月前
starrocks·clickhouse·存算分离·ubt架构·湖仓查询
从 ClickHouse 到 StarRocks 存算分离: 携程 UBT 架构升级实践作者:魏宁 携程大数据平台开发专家导读:在携程庞大的数据体系中,UBT(User Behavior Tracking,用户行为追踪系统)承担着核心的用户行为采集与分析任务,日新增数据量高达 30 TB。为应对不断增长的业务与性能需求,携程技术团队将 UBT 从 ClickHouse 迁移至 StarRocks 存算分离架构。
syty20202 个月前
starrocks
StarRocks 是如何进行并行计算我们来深入浅出地讲解一下 StarRocks 是如何进行并行计算的。StarRocks 的并行计算能力是其高性能的核心,它主要基于 MPP(大规模并行处理) 架构,并结合了向量化执行引擎。简单来说,它的并行计算可以概括为 “数据分布与计算并行” 和 “执行引擎优化” 两个层面。
syty20202 个月前
starrocks
starrocks有哪些operatorStarRocks 中的 Operator(操作符) 是执行引擎中的基本计算单元,它们组成了查询的执行计划。每个 Operator 负责完成一个特定的、相对单一的数据处理任务。
StarRocks_labs3 个月前
数据库·starrocks·iceberg·存算分离·lakehouse 架构
StarRocks:Connect Data Analytics with the World作者:StarRocks TSC Member、镜舟科技 CTO——张友东本文基于镜舟科技 CTO、StarRocks TSC 成员张友东在 StarRocks Connect 2025 活动上的主题分享整理而成。围绕大会的核心主题——“数据与世界的连接”,本文将从三个维度进行阐述:
StarRocks_labs3 个月前
大数据·starrocks·clickhouse·存算一体·postgres mvp
StarRocks 助力印度领先即时零售平台 Zepto 构建实时洞察能力导读:开源无国界,在本期 “StarRocks 全球用户精选案例” 中,我们走进印度即时零售品牌 Zepto。
StarRocks_labs3 个月前
starrocks·数据湖·阿里巴巴·paimon·物化视图
淘宝闪购实时分析黑科技:StarRocks + Paimon撑起秋天第一波奶茶自由作者:马龙杰(澄诺) 阿里巴巴中国电商事业群-饿了么-DIC 数据智能中心-数据研发流量组摘要:实时湖仓架构赋能即时零售,在多端流量与亿级营销投入下支撑分钟级决策与体验升级。