iceberg

分布式存储与RustFS1 天前
rust·开源·iceberg·对象存储·rustfs·minio平替·s3 table
基于Rust的国产开源对象存储RustFS:S3 Table对Iceberg数据湖的适配详解目录一、传统对象存储适配Iceberg的核心痛点二、RustFS S3Table的核心适配设计思路三、RustFS S3Table适配Iceberg的核心落地优势
分布式存储与RustFS1 天前
开源·apache·iceberg·rustfs·ai存储·ai memory·s3 table
Apache Iceberg数据湖轻量化搭建:基于Rust开源存储方案目录一、传统Iceberg部署模式的普遍痛点二、为什么RustFS更适合轻量化Iceberg数据湖搭建?
yyoc973 天前
大数据·ai·flink·kubernetes·iceberg
本地 Flink on K8s + Iceberg + MinIO 实时数仓平台 — AI部署指南与踩坑实录本项目使用Qwen3.7模型,在 macOS 本地环境搭建了一套完整的轻量级实时数仓平台,技术栈包括 Minikube (K8s)、Apache Flink 1.19.1、Apache Iceberg 1.10.2、MinIO 对象存储和 Kafka 消息队列。所有组件部署在 Minikube 单集群的 data-platform namespace 中,资源控制在 4 CPU / 6 GB 内存以内。
StarRocks_labs6 天前
数据库·starrocks·sql·iceberg·物化视图
StarRocks × Iceberg:联邦查询实践解析导读:本文结合 Fresha 的实际案例,介绍了其如何利用 StarRocks 构建基于 Iceberg 的联邦查询架构,并分析了 Metadata Cache、自适应元数据读取、冷热数据分层等关键能力在实际场景中的应用。
StarRocks_labs2 个月前
starrocks·sql·架构·iceberg·作业帮
从 Presto 到 StarRocks:作业帮架构升级实践作者:作业帮大数据团队(覃争、孙建业、刘泽强)作业帮的 Presto 主要承载即席查询场景,天级查询规模在 2000~5000 次,但均值耗时在分钟级,整体性能偏慢;同时由于与 Yarn、HDFS 混部,高峰期宿主机 CPU 经常打满,资源争抢严重,查询体验波动明显。
迎仔4 个月前
apache·iceberg
08-Apache Iceberg 通俗指南:给“胡乱堆放”的文件加个“智能账本”在大数据的世界里(比如 HDFS 或 S3),文件通常是散落着的。比如一个“用户表”,实际上是文件夹里堆着的 10000 个 csv 或 parquet 小文件。
AlfredZhao6 个月前
iceberg
为什么 Iceberg 在数据湖领域这么火最近打开技术社区,满眼都是 Apache Iceberg。无论是在大厂的架构分享中,还是在云厂商的推介里,它都占据了“C位”。
zgxme6 个月前
iceberg·database
Iceberg Rest Catalog + OSS 实践踩坑记录:Polaris x-amz-content-sha256 报错 与 Nessie 配置最近在做查询引擎Iceberg 性能测试,主要是环境准备、测试集准备、性能测试开展。 本篇只包括环境准备部分,记录下环境准备过程,几个方面:
StarRocks_labs9 个月前
数据库·starrocks·iceberg·存算分离·lakehouse 架构
StarRocks:Connect Data Analytics with the World作者:StarRocks TSC Member、镜舟科技 CTO——张友东本文基于镜舟科技 CTO、StarRocks TSC 成员张友东在 StarRocks Connect 2025 活动上的主题分享整理而成。围绕大会的核心主题——“数据与世界的连接”,本文将从三个维度进行阐述:
StarRocks_labs10 个月前
数据库·starrocks·iceberg·湖仓一体架构·herdwatch
欧洲数字化养殖平台 Herdwatch 借力 Iceberg + StarRocks 提升分析能力作者:Alfred Johnson,Herdwatch 数据负责人导读:开源无国界,在本期“StarRocks 全球用户精选案例”专栏中,我们将介绍欧洲数字化养殖管理平台 Herdwatch。
朽木自雕,格物致知!10 个月前
iceberg·flinksql
iceberg FlinkSQL 特性iceberg 1.2.0flink 1.16.0创建一个带有主键的FlinkSQL表截止 iceberg 1.2.0 FlinkSQL 不支持隐式分区,不支持计算列,watermark
智海观潮1 年前
大数据·人工智能·ai·iceberg·catalog
Unity Catalog与Apache Iceberg如何重塑Data+AI时代的企业数据架构在2025年Data+AI Summit上,Databricks发布了一系列重大更新,标志着企业数据治理进入新阶段。其中,Unity Catalog的增强功能和对Apache Iceberg的全面支持尤为引人注目。这些更新不仅强化了跨平台数据管理能力,还推动了开放数据生态的发展。本文将从技术演进、行业实践和未来趋势三个维度,分析这些创新如何重塑企业数据架构。 一、Unity Catalog:构建智能化的数据治理体系
LiRuiJie1 年前
大数据·hadoop·flink·iceberg·flinkcdc
基于Hadoop3.3.4+Flink1.17.0+FlinkCDC3.0.0+Iceberg1.5.0整合,实现数仓实时同步mysql数据验证:添加如下内容:验证:在两台机器都执行:添加:执行使其生效:假设 Hadoop 安装目录是 /opt/hadoop,配置文件在 $HADOOP_HOME/etc/hadoop/ 下。
StarRocks_labs1 年前
大数据·starrocks·人工智能·iceberg·lakehouse·智能bi·湖仓分析
Lakehouse x AI ,打造智能 BI 新体验本文整理自瓴羊的王璟尧老师与镜舟科技石强老师的联合分享,围绕 Quick BI 在智能 BI 场景中的落地实践,深入探讨了 StarRocks 如何凭借 MPP 架构、实时分析能力与 AI 原生支持,成为智能分析的理想 Lakehouse 引擎底座,助力 BI 从“被动查询”迈向“主动决策”,开启数据“会说话”的新体验。
兰丰岐1 年前
iceberg·amoro·apache amoro
使用apache amoro + trino+minio搭建iceberg数据湖架构以下是基于 Apache Amoro + Trino + MinIO 搭建 Iceberg 数据湖架构的核心步骤和关键配置:
ClouGence1 年前
数据库·mysql·iceberg·dba
MySQL + CloudCanal + Iceberg + StarRocks 构建全栈数据服务在业务数据快速膨胀的今天,企业对 低成本存储 与 实时查询分析能力 的需求愈发迫切。本文将带你实战构建一条 MySQL 到 Iceberg 的数据链路,借助 CloudCanal 快速完成数据迁移与同步,并使用 StarRocks 完成数据查询等操作,构建涵盖 关系型数据库服务、实时数据分析、大数据存取 的全栈数据架构。
StarRocks_labs1 年前
大数据·starrocks·云原生·iceberg·物化视图
StarRocks x Iceberg:云原生湖仓分析技术揭秘与最佳实践导读:本文将深入探讨基于 StarRocks 和 Iceberg 构建的云原生湖仓分析技术,详细解析两者结合如何实现高效的查询性能优化。内容涵盖 StarRocks Lakehouse 架构、与 Iceberg 的性能协同、最佳实践应用以及未来的发展规划,为您提供全面的技术解读。
镜舟科技1 年前
starrocks·数据分析·apache·iceberg·数据湖·湖仓一体·元数据
Apache Iceberg 解析,一文了解Iceberg定义、应用及未来发展Apache Iceberg 是一种开源的 表格式(Table Format) ,专为超大规模数据分析场景设计,通过标准化数据存储规范与访问协议,解决了传统数据湖在元数据管理、事务控制、查询性能等方面的核心痛点。以下从六个维度全面解析其技术原理、应用场景与最佳实践。
小涵1 年前
大数据·数据库·分布式·阿里云·架构·iceberg·hudi
【分布式】冰山(Iceberg)与哈迪(Hudi)对比的基准测试推荐超级课程:分布式系统行业正迅速向表格式(TableFormats)和湖仓架构(Lakehouse Architecture)靠拢,以实现数据湖(Data Lakes)的现代化。
徐一闪_BigData1 年前
大数据·sql·flink·iceberg
数仓开发那些事(10)某神州优秀员工:(没错,这个diao毛被评为了优秀员工)一闪,听说你跑路了,不做零售行业了 一闪:没错,老东家的新it总监上任后大家都开始躺平,失去了当年的动力,所以需要换个环境 某神州优秀员工:躺平不好吗 一闪:等你到我这个年纪你就明白了..... 某神州优秀员工:你tm不是00后吗.....