技术栈
starrocks
镜舟科技
11 小时前
starrocks
·
数据分析
·
ai agent
·
lakehouse
·
hpe
镜舟科技出席 HPE 新品发布会,携手打造“Lakehouse + AI”智能数据底座
2026 年 5 月 26 日,HPE 在北京举行新品发布会,多家专业媒体、业内专家及行业客户共同见证了 HPE 新一代企业级文件和对象存储 HPE Alletra Storage MP X10000 系列的正式发布。
镜舟科技
13 小时前
starrocks
·
大模型
·
prompt
·
ai agent
·
数据基础设施
·
上下文工程
从 Prompt 到 Context Engineering:如何用 StarRocks 构建 AI Agent 的实时上下文引擎?
全球 Lakehouse 架构的部署正在加速普及。然而,一个更深层的范式转变正在悄然发生:企业数据基础设施的服务对象,正在从人向 AI 迁移。
StarRocks_labs
14 小时前
数据库
·
starrocks
·
sql
·
iceberg
·
物化视图
StarRocks × Iceberg:联邦查询实践解析
导读:本文结合 Fresha 的实际案例,介绍了其如何利用 StarRocks 构建基于 Iceberg 的联邦查询架构,并分析了 Metadata Cache、自适应元数据读取、冷热数据分层等关键能力在实际场景中的应用。
StarRocks_labs
3 天前
starrocks
·
olap
·
automq
·
fresha
·
kafk
AutoMQ x StarRocks: 英国美容健康领导者 Fresha 如何构建现代化实时分析数据栈
每天早晨,全球数十万美容与健康服务商家打开 Fresha 首页,第一时间查看昨天的营收、当天预约和员工表现。几个看似简单的数字背后,是每日 60 万笔预约、数十亿条数据库变更事件,以及峰值每秒 3,000 次请求共同支撑的实时数据管道。
阿里云大数据AI技术
8 天前
starrocks
·
人工智能
·
sql
·
阿里云
·
ai function
最佳实践:用 EMR Serverless StarRocks AI Function 实现金融行业文本分类_
摘要:在金融行业,客户投诉、监管公告、合同文本等非结构化数据蕴含着巨大的业务价值。传统方案需要将数据导出到外部 NLP 系统处理,链路长、延迟高且存在数据泄露风险。本文中的最佳实践介绍了如何利用 StarRocks AI Function,通过纯 SQL 实现情感分析、智能分类、信息抽取和 PII 脱敏,实现“数据不出库”的端到端智能分析。
鸿乃江边鸟
11 天前
starrocks
·
mac
·
编译
Starrocks BE 在Mac编译以及遇到的问题解决
本文基于Starrocks 4.x 在机器 Apple M5 MacOS Tahoe 26 系统上进行编译,
想ai抽
17 天前
大数据
·
starrocks
·
olap
StarRocks 存储引擎设计深度调研笔记
StarRocks 数据组织层级:Table → Partition → Bucket (Tablet) → Replica → Rowset → Segment
胖胖胖胖胖虎
18 天前
starrocks
·
okhttp
okhttp Stream Load 含认证请求重定向
http 请求 StarRocks Stream Load,遇到错误码:307no valid Basic authorization
涤生大数据
19 天前
大数据
·
starrocks
·
数仓
·
数据科学
·
大数据开发
·
diris
Doris/StarRocks 高频面试题通关指南
对于大数据开发和数据仓库工程师来说(尤其是实时方向来说),Apache Doris 和 StarRocks 已经成为面试中无法绕开的高频重头戏。
StarRocks_labs
22 天前
starrocks
·
saas
·
query
·
存算一体
·
warehouse
白天查数、凌晨跑批:聚水潭如何基于 StarRocks 将资源利用率提升 3x
作者:番杏(张国鑫),大数据开发专家|溪竹(李月),高级大数据开发专家每天早高峰,电商商家陆续打开聚水潭后台,查看销售、库存、订单等核心报表。对商家来说,这只是一次普通的经营分析;但对底层数据平台来说,却意味着大量在线查询在短时间内集中到来。
想ai抽
25 天前
大数据
·
starrocks
·
kylin
Kylin 全局字典机制与 StarRocks Bitmap 精确去重技术调研
数仓开发中,COUNT(DISTINCT) 是计算开销极高的操作。传统方式需要在分布式环境下进行多次 Shuffle,性能随数据量增大直线下降。同时,StarRocks 的 Bitmap 类型字段仅支持整数(BigInt/Int),而业务中的去重键(如 user_id、order_id)往往是字符串类型,必须通过全局字典将字符串映射为全局唯一整数,才能写入 Bitmap 字段实现精确去重。
StarRocks_labs
1 个月前
starrocks
·
sql
·
clickhouse
·
ai赋能
·
kapture
KaptureCX 大规模实时分析架构演进:基于 RisingWave 与 StarRocks 的最佳实践
导读:KaptureCX 是一家专注于客户支持自动化平台的企业,服务于电子商务、医疗保健、金融等多个垂直领域的客户。随着业务的增长,其数据平台面临着**海量工单状态频繁更新(Heavy Upserts)以及复杂多表关联查询(Heavy Joins)**的双重挑战。
ClouGence
2 个月前
大数据
·
数据库
·
starrocks
·
olap
·
dba
·
oltp
·
spanner
从 OLTP 到 OLAP:Spanner 到 StarRocks 架构演进与实现
同样的数据,放在不同的系统里,成本可以相差数倍。这是我们的用户完成 Google Spanner 到 StarRocks 迁移后的真实结果,分析成本直接降低了 70%–80%。
万琛
2 个月前
starrocks
·
性能优化
【StarRocks / Doris】Broker Load 性能优化实战
适用人群:数据开发初学者、初级数据工程师、刚接触 MPP 数据库导入的同学 文章目标:把 Broker Load 的性能优化讲清楚,尤其是“指定分区导入”“为什么不建议并行写同一张表”“多批次大文件写单表如何稳又快” 版本说明:
Austinu
2 个月前
starrocks
·
flink cdc
·
sqlsever
Flink CDC 做SQL Server → StarRocks 的全量 + 增量同步对源数据库的压力分析
Flink CDC 做 SQL Server → StarRocks 的全量 + 增量同步,对 SQL Server 一定会产生压力。 但压力大小取决于:
Austinu
2 个月前
starrocks
StarRocks入门
https://docs.mirrorship.cn/zh/docs/quick_start/shared-nothing/
老徐电商数据笔记
2 个月前
starrocks
·
数据治理
·
实时数仓
·
selectdb
·
电商数据仓库
电商实时数仓开发规范
说明:本规范可作为电商/跨境电商实时数仓开发规范参考。版本记录本规范适用于基于 阿里云 SelectDB(StarRocks) + Flink CDC + Kafka + Apache Paimon 架构的电商实时数仓开发。所有实时数据链路的设计、开发、上线、运维均须遵守本规范。
StarRocks_labs
2 个月前
starrocks
·
sql
·
pipeline
·
mpp
·
fe
StarRocks I/O 模型揭秘(一):查询是如何被拆解与调度的?
作者:丁凯 StarRocks TSC Member导读:在存算分离架构下,查询性能的稳定性越来越依赖底层 I/O 设计。本文作为 StarRocks I/O 模型揭秘系列首篇,将围绕 Tablet、Fragment、Pipeline、Morsel、Scan Operator 等核心概念,梳理一次查询执行过程中底层 I/O 链路的基本运行机制
StarRocks_labs
2 个月前
starrocks
·
sql
·
架构
·
iceberg
·
作业帮
从 Presto 到 StarRocks:作业帮架构升级实践
作者:作业帮大数据团队(覃争、孙建业、刘泽强)作业帮的 Presto 主要承载即席查询场景,天级查询规模在 2000~5000 次,但均值耗时在分钟级,整体性能偏慢;同时由于与 Yarn、HDFS 混部,高峰期宿主机 CPU 经常打满,资源争抢严重,查询体验波动明显。