技术栈
starrocks
镜舟科技
1 天前
starrocks
·
数据分析
·
开源
·
数字化转型
·
华为鲲鹏
·
lakehouse
·
镜舟科技
活动回顾 | 镜舟科技出席鲲鹏开发者创享日・北京站
12月12日,由华为技术有限公司主办的“鲲鹏开发者创享日・北京站”在北京圆满落幕。作为中国领先的企业级数据基础设施服务商,镜舟科技受邀出席,并亮相“开发者解决方案展区”,与现场顶尖技术大咖、科研领袖及行业伙伴共同探讨前沿科技,展示了新一代数据架构的无限可能。
鹿衔`
5 天前
starrocks
·
apache
·
paimon
StarRocks 2.5.22 混合部署实战文档(CDH环境)
目录1. 项目背景与环境节点分配2. 核心规划 (避坑关键)2.1 端口规划表2.2 目录规划3. 部署前置准备 (nd11, nd12, nd13)
StarRocks_labs
6 天前
数据库
·
starrocks
·
compaction
·
memtable
·
本地磁盘 spill
从小文件困局到“花小钱办大事”:StarRocks 存算分离批量导入优化实践
作者:罗一鑫 StarRocks Committer导读:在存算分离架构下,“一次性导入海量历史数据”正成为被放大的隐形风险。本文介绍 StarRocks 如何从写入源头重构大导入路径:通过“内存→本地磁盘 spill→集中 merge→对象存储”,减少远程写入和重复开销,降低 S3 写入次数并放大文件粒度,释放本地 I/O 能力,从源头缓解小文件问题,帮助用户以更低投入获得更高效、更稳定的使用体验。
想ai抽
9 天前
starrocks
·
doris
·
数据湖
StarRocks PB 级日增量数据模型优化:注意点、调优策略与风险防控
StarRocks 处理每日 PB 级日增量时,核心矛盾是「高吞吐导入」与「低延迟查询」的平衡,需从 数据模型设计、导入链路、存储查询、资源调度、稳定性保障 五维度系统性优化,同时规避增量场景下的典型风险。以下是具体细节:
杰克逊的日记
2 个月前
starrocks
·
数据仓库
·
mpp
StarRocks数据仓库
StarRocks 是一款 高性能、实时分析型数据库(OLAP),由字节跳动开源(2020 年开源,2023 年进入 Apache 孵化器),核心定位是 “实时数仓 + 湖仓一体”,专为 PB 级数据的快速查询、多维分析、实时报表等场景设计,广泛应用于互联网、金融、零售、政务等行业。
StarRocks_labs
2 个月前
starrocks
·
人工智能
·
json
·
数据湖
·
存算分离
StarRocks 4.0:Real-Time Intelligence on Lakehouse
回顾 StarRocks 的进化之路,每一次大版本迭代都紧扣时代对数据分析的核心诉求。StarRocks 1.x,打造极速查询性能,解决 BI 报表、数据探寻慢的痛点问题。
StarRocks_labs
2 个月前
大数据
·
数据库
·
starrocks
·
hadoop
·
存算分离
告别 Hadoop,拥抱 StarRocks!政采云数据平台升级之路
作者:李进勇 政采云研发中心数据平台负责人导读:在当下数字化转型的浪潮中,数据早已从辅助资源跃升为核心生产资料和决策基础。政府提升治理效能,企业优化运营、创新服务,都深度依赖对海量数据的实时洞察与高效处理。
StarRocks_labs
2 个月前
数据库
·
starrocks
·
json
·
存算分离
·
olap 技术栈
StarRocks 在 Cisco Webex 的探索与实践
作者:白旭:Cisco Software Engineer, Apache Amoro PPMC member
StarRocks_labs
2 个月前
starrocks
·
connect 2025
StarRocks Community Monthly Newsletter (Sep)
v3.5.6功能增强:当 Vacuum 成功时会更新 Vacuum 指标。在 Fragment 实例执行状态报告中新增线程池指标,包括活动线程数、队列数量和运行线程数。
码以致用
2 个月前
数据库
·
starrocks
·
olap
·
1024程序员节
StarRocks笔记
StarRocks 是新一代极速统一的云原生MPP数据库。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户无需经过复杂的预处理,就可以用 StarRocks 来支持多种数据分析场景的极速分析。
MARSERERER
2 个月前
starrocks
·
clickhouse
ClickHouse迁移Starrocks脚本工具
使用方法:执行sh process_inspect_event_dist.sh先导出ClickHouse数据至CSV文件:
StarRocks_labs
2 个月前
starrocks
·
kubernetes
·
数据备份
·
存算一体架构
·
快照恢复机制
Kubernetes 场景下的 StarRocks 灾备体系:Cluster Snapshot 实践解析
在存算一体架构下,StarRocks 通过 Failover Group、Backup & Restore 以及 Insert Into Files 等机制,实现了集群级的灾备与数据的备份和恢复能力。伴随性能优化与功能演进的持续推进,StarRocks 不断强化系统的稳定性与可用性,以满足企业日益增长的实时分析与高可用需求。
StarRocks_labs
2 个月前
starrocks
·
clickhouse
·
存算分离
·
ubt架构
·
湖仓查询
从 ClickHouse 到 StarRocks 存算分离: 携程 UBT 架构升级实践
作者:魏宁 携程大数据平台开发专家导读:在携程庞大的数据体系中,UBT(User Behavior Tracking,用户行为追踪系统)承担着核心的用户行为采集与分析任务,日新增数据量高达 30 TB。为应对不断增长的业务与性能需求,携程技术团队将 UBT 从 ClickHouse 迁移至 StarRocks 存算分离架构。
syty2020
2 个月前
starrocks
StarRocks 是如何进行并行计算
我们来深入浅出地讲解一下 StarRocks 是如何进行并行计算的。StarRocks 的并行计算能力是其高性能的核心,它主要基于 MPP(大规模并行处理) 架构,并结合了向量化执行引擎。简单来说,它的并行计算可以概括为 “数据分布与计算并行” 和 “执行引擎优化” 两个层面。
syty2020
2 个月前
starrocks
starrocks有哪些operator
StarRocks 中的 Operator(操作符) 是执行引擎中的基本计算单元,它们组成了查询的执行计划。每个 Operator 负责完成一个特定的、相对单一的数据处理任务。
StarRocks_labs
3 个月前
数据库
·
starrocks
·
iceberg
·
存算分离
·
lakehouse 架构
StarRocks:Connect Data Analytics with the World
作者:StarRocks TSC Member、镜舟科技 CTO——张友东本文基于镜舟科技 CTO、StarRocks TSC 成员张友东在 StarRocks Connect 2025 活动上的主题分享整理而成。围绕大会的核心主题——“数据与世界的连接”,本文将从三个维度进行阐述:
StarRocks_labs
3 个月前
大数据
·
starrocks
·
clickhouse
·
存算一体
·
postgres mvp
StarRocks 助力印度领先即时零售平台 Zepto 构建实时洞察能力
导读:开源无国界,在本期 “StarRocks 全球用户精选案例” 中,我们走进印度即时零售品牌 Zepto。
StarRocks_labs
3 个月前
starrocks
·
数据湖
·
阿里巴巴
·
paimon
·
物化视图
淘宝闪购实时分析黑科技:StarRocks + Paimon撑起秋天第一波奶茶自由
作者:马龙杰(澄诺) 阿里巴巴中国电商事业群-饿了么-DIC 数据智能中心-数据研发流量组摘要:实时湖仓架构赋能即时零售,在多端流量与亿级营销投入下支撑分钟级决策与体验升级。