iceberg

StarRocks：Connect Data Analytics with the World作者：StarRocks TSC Member、镜舟科技 CTO——张友东本文基于镜舟科技 CTO、StarRocks TSC 成员张友东在 StarRocks Connect 2025 活动上的主题分享整理而成。围绕大会的核心主题——“数据与世界的连接”，本文将从三个维度进行阐述：

欧洲数字化养殖平台 Herdwatch 借力 Iceberg + StarRocks 提升分析能力作者：Alfred Johnson，Herdwatch 数据负责人导读：开源无国界，在本期“StarRocks 全球用户精选案例”专栏中，我们将介绍欧洲数字化养殖管理平台 Herdwatch。

朽木自雕，格物致知！

iceberg FlinkSQL 特性iceberg 1.2.0flink 1.16.0创建一个带有主键的FlinkSQL表截止 iceberg 1.2.0 FlinkSQL 不支持隐式分区，不支持计算列，watermark

Unity Catalog与Apache Iceberg如何重塑Data+AI时代的企业数据架构在2025年Data+AI Summit上，Databricks发布了一系列重大更新，标志着企业数据治理进入新阶段。其中，Unity Catalog的增强功能和对Apache Iceberg的全面支持尤为引人注目。这些更新不仅强化了跨平台数据管理能力，还推动了开放数据生态的发展。本文将从技术演进、行业实践和未来趋势三个维度，分析这些创新如何重塑企业数据架构。一、Unity Catalog：构建智能化的数据治理体系

基于Hadoop3.3.4+Flink1.17.0+FlinkCDC3.0.0+Iceberg1.5.0整合，实现数仓实时同步mysql数据验证：添加如下内容：验证：在两台机器都执行：添加：执行使其生效：假设 Hadoop 安装目录是 /opt/hadoop，配置文件在 $HADOOP_HOME/etc/hadoop/ 下。

Lakehouse x AI ，打造智能 BI 新体验本文整理自瓴羊的王璟尧老师与镜舟科技石强老师的联合分享，围绕 Quick BI 在智能 BI 场景中的落地实践，深入探讨了 StarRocks 如何凭借 MPP 架构、实时分析能力与 AI 原生支持，成为智能分析的理想 Lakehouse 引擎底座，助力 BI 从“被动查询”迈向“主动决策”，开启数据“会说话”的新体验。

使用apache amoro + trino+minio搭建iceberg数据湖架构以下是基于 Apache Amoro + Trino + MinIO 搭建 Iceberg 数据湖架构的核心步骤和关键配置：

MySQL + CloudCanal + Iceberg + StarRocks 构建全栈数据服务在业务数据快速膨胀的今天，企业对低成本存储与实时查询分析能力的需求愈发迫切。本文将带你实战构建一条 MySQL 到 Iceberg 的数据链路，借助 CloudCanal 快速完成数据迁移与同步，并使用 StarRocks 完成数据查询等操作，构建涵盖关系型数据库服务、实时数据分析、大数据存取的全栈数据架构。

StarRocks x Iceberg：云原生湖仓分析技术揭秘与最佳实践导读：本文将深入探讨基于 StarRocks 和 Iceberg 构建的云原生湖仓分析技术，详细解析两者结合如何实现高效的查询性能优化。内容涵盖 StarRocks Lakehouse 架构、与 Iceberg 的性能协同、最佳实践应用以及未来的发展规划，为您提供全面的技术解读。

Apache Iceberg 解析，一文了解Iceberg定义、应用及未来发展Apache Iceberg 是一种开源的表格式（Table Format），专为超大规模数据分析场景设计，通过标准化数据存储规范与访问协议，解决了传统数据湖在元数据管理、事务控制、查询性能等方面的核心痛点。以下从六个维度全面解析其技术原理、应用场景与最佳实践。

【分布式】冰山（Iceberg）与哈迪（Hudi）对比的基准测试推荐超级课程：分布式系统行业正迅速向表格式（TableFormats）和湖仓架构（Lakehouse Architecture）靠拢，以实现数据湖（Data Lakes）的现代化。

徐一闪_BigData

数仓开发那些事(10)某神州优秀员工：（没错，这个diao毛被评为了优秀员工）一闪，听说你跑路了，不做零售行业了一闪：没错，老东家的新it总监上任后大家都开始躺平，失去了当年的动力，所以需要换个环境某神州优秀员工：躺平不好吗一闪：等你到我这个年纪你就明白了..... 某神州优秀员工：你tm不是00后吗.....

SelectDB技术团队

天翼云：Apache Doris + Iceberg 超大规模湖仓一体实践导读：天翼云基于 Apache Doris 成功落地项目已超 20 个，整体集群规模超 50 套，部署节点超 3000 个，存储容量超 15PB。天翼云基于 Apache Doris 和 Apache Iceberg 构建的湖仓一体方案，兼具灵活性、高性能和低成本优势，同时满足了报表和 BI 分析、湖仓融合分析、日志存储分析、高并发实时分析、MPPDB 国产化替代等多种场景需求。

徐一闪_BigData

Flink读取Kafka数据写入IceBerg（HiveCatalog）java8 flink1.13 kafka3 iceberg0.13链路：Kafka -> Flink-> IceBerg（HiveCatalog）

实时数仓：Apache Iceberg 的表管理与实时数仓架构设计Apache Iceberg 是一种面向大规模数据湖的开源表格式，适用于批处理和流处理场景，具有 ACID 事务支持、高效的元数据管理、时间旅行等特点。以下内容涵盖 Iceberg 的表设计、实时数据处理（Flink 或 Spark）、性能优化及数据治理细节。

Hive集成Iceberg碰到的问题想基于尚硅谷的数仓的环境（完成了hadoop组件和hive的安装）做实时流的开发，于是在集成Iceberg的时候，就复用了原始的环境，但是在成功创建iceberg表，对其插入数据，执行MR的过程中报错了。

Iceberg 写入和更新模式，COW，MOR（Copy-on-Write,Merge-on-Read)https://en.wikipedia.org/wiki/Copy-on-write Copy-On-Write 模式在 v1 表或者 v2 表都可以使用。

Iceberg Catalog 的实现和迁移Iceberg Catalog 的接口定义了各种 Catalog 需要实现的方法，主要包括列出存在的表，创建表，删除表，检查表是否存在，给表改名。

Apache Iceberg 与 Spark整合-使用教程（Iceberg 官方文档解析）Spark 目前是进行 Iceberg 操作最丰富的计算引擎。官方建议从 Spark 开始，以理解 Iceberg 的概念和功能。

Apache Iceberg 试用因为 iceberg 相关的 jars 已经在 ${SPARK_HOME}/jars 目录，所以不用 --jars 或者 --package 参数。