湖仓一体

镜舟科技4 天前
starrocks·数据分析·apache·iceberg·数据湖·湖仓一体·元数据
Apache Iceberg 解析,一文了解Iceberg定义、应用及未来发展Apache Iceberg 是一种开源的 表格式(Table Format) ,专为超大规模数据分析场景设计,通过标准化数据存储规范与访问协议,解决了传统数据湖在元数据管理、事务控制、查询性能等方面的核心痛点。以下从六个维度全面解析其技术原理、应用场景与最佳实践。
镜舟科技7 天前
数据仓库·湖仓一体·分析型数据库·存算分离·starrocks 主键·主键模型·实时数据分析
StarRocks 主键(Primary Key)深度解析StarRocks 是一款高性能分析型数据库,专为海量数据的实时分析而设计。作为新一代湖仓(Lakehouse)加速引擎,StarRocks 融合了 MPP 架构和列式存储引擎的优势,能够支持亿级数据秒级查询响应。
StarRocks_labs9 天前
数据仓库·架构·数据分析·云计算·湖仓一体
vivo 湖仓架构的性能提升之旅作者:郭小龙 vivo互联网 大数据高级研发工程师导读:本文整理自 vivo互联网 大数据高级研发工程师 郭小龙 在 StarRocks 年度峰会上的分享,聚焦 vivo 大数据多维分析面临的挑战、StarRocks 落地方案及应用收益。
涤生大数据11 天前
数据仓库·数据挖掘·数据分析·doris·数据湖·数字化转型·湖仓一体
Doris 湖仓一体:数据分析新范式在大数据的浪潮里,企业数据量呈爆发式增长,数据处理和分析的需求也变得越来越复杂。传统的数据库、数据仓库和数据湖各管一摊,彼此割裂,导致数据利用效率大打折扣。这个时候,湖仓一体的概念横空出世,像是一场 及时雨,为企业的数据管理带来了全新的可能性。今天,我们就来聊聊 基于 Doris 的湖仓一体,看看它到底是怎么解决数据管理的难题,让企业玩转大数据的!
SelectDB技术团队12 天前
大数据·数据库·iceberg·doris·数据湖·湖仓一体·天翼云
天翼云:Apache Doris + Iceberg 超大规模湖仓一体实践导读:天翼云基于 Apache Doris 成功落地项目已超 20 个,整体集群规模超 50 套,部署节点超 3000 个,存储容量超 15PB。天翼云基于 Apache Doris 和 Apache Iceberg 构建的湖仓一体方案,兼具灵活性、高性能和低成本优势,同时满足了报表和 BI 分析、湖仓融合分析、日志存储分析、高并发实时分析、MPPDB 国产化替代等多种场景需求。
StarRocks_labs13 天前
大数据·starrocks·阿里云·架构·湖仓一体
StarRocks + Paimon 在阿里集团 Lakehouse 的探索与实践作者:范振: 阿里云计算平台开源 OLAP 负责人,StarRocks 社区 Champion翁才智: 阿里云技术专家,Apache Paimon PMC Member
王百万_1 个月前
数据治理·hudi·湖仓一体·ddl·华为mrs·create table
【Hudi-SQL DDL创建表语法】命令功能CREATE TABLE命令通过指定带有表属性的字段列表来创建Hudi Table。命令格式参数描述
StarRocks_labs1 个月前
大数据·架构·spark·湖仓一体·lakehouse
小红书湖仓架构的跃迁之路作者:李鹏霖(丁典),小红书-研发工程师,StarRocks Contributor & Apache Impala Committer
StarRocks_labs2 个月前
大数据·架构·spark·湖仓一体·lakehouse
从 Spark 到 StarRocks:实现58同城湖仓一体架构的高效转型作者:王世发,吴艳兴等,58同城数据架构部导读:本文介绍了58同城在其数据探查平台中引入StarRocks的实践,旨在提升实时查询性能。在面对传统Spark和Hive架构的性能瓶颈时,58同城选择StarRocks作为加速引擎,增强数据湖的分析能力。在迁移过程中,团队克服了多个兼容性问题,并对系统进行了稳定性和易用性的改进,特别是在Java UDF支持和SQL黑名单功能方面。
Moshow郑锴4 个月前
大数据·数据库·数据仓库·数据湖·湖仓一体
数据库、数据仓库、数据湖、数据中台、湖仓一体的概念和区别数据库、数据仓库、数据湖、数据中台和湖仓一体是数据管理和分析领域的不同概念,各自有不同的特点和应用场景。以下是它们的主要区别:
StarRocks_labs4 个月前
人工智能·湖仓一体·lakehouse
StarRocks Summit Asia 2024 全部议程公布!随着企业数字化转型深入,云原生架构正成为湖仓部署的新标准。弹性扩展、资源隔离、成本优化,帮助企业在云上获得了更高的灵活性和效率。与此同时,云原生架构也为湖仓与 AI 的深度融合奠定了基础。
阿里云大数据AI技术5 个月前
大数据·olap·emr·dataworks·湖仓一体
DataWorks on EMR StarRocks,打造标准湖仓新范式在大数据领域,数据仓库和实时分析系统扮演着至关重要的角色。DataWorks 基于大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台,为用户带来智能化的数据开发和分析体验。而阿里云提供的 EMR Serverless StarRocks 全托管服务(下文简称 StarRocks),专注于实时分析场景,可提供高性能、全场景、极速统一的数据分析体验。
hf2000125 个月前
大数据·数据仓库·云原生·数据挖掘·数据分析·湖仓一体
比流计算资源效率最高提升 1000 倍,“增量计算”新模式能否颠覆数据分析?作者 | 关涛 云器科技CTO数据平台领域发展 20 年,逐渐成为每个企业的基础设施。作为一个进入“普惠期”的领域,当下的架构已经完美了吗,主要问题和挑战是什么?在 2023 年 AI 跃变式爆发的大背景下,数据平台又该如何演进,以适应未来的数据使用场景?
StarRocks_labs6 个月前
大数据·flink·湖仓一体·paimon·lakehouse
饿了么基于Flink+Paimon+StarRocks的实时湖仓探索作者:王沛斌@饿了么小编导读:本文整理自饿了么大数据架构师、Apache Flink Contributor 王沛斌老师在8月3日 Streaming Lakehouse Meetup Online(Paimon x StarRocks,共话实时湖仓架构)上的分享。主要分为以下三个内容:
SelectDB技术团队7 个月前
数据库·doris·trino·湖仓一体·lakehouse
兼容Trino Connector,扩展Apache Doris数据源接入能力|Lakehouse 使用手册(四)Apache Doris 内置支持包括 Hive、Iceberg、Hudi、Paimon、LakeSoul、JDBC 在内的多种 Catalog,并为其提供原生高性能且稳定的访问能力,以满足与数据湖的集成需求。而随着 Apache Doris 用户的增加,新的数据源连接需求也随之增加。因此,从 3.0 版本开始,Apache Doris 引入了 Trino Connector 兼容框架。
SelectDB技术团队7 个月前
数据仓库·数据分析·湖仓一体·hicool
从 7000 余项目脱颖而出,飞轮科技《新一代实时分析数据仓库解决方案》荣获 HICOOL 2024 全球创业大赛二等奖HICOOL 2024 全球创业者峰会于 2024 年 8 月 23 日 -25 日 在中国国际展览中心(顺义馆)成功举行,峰会以“新质引领 创新共融”为主题,聚焦技术创新、产业融合、新质共享与国际合作四大要素。
Apache Flink7 个月前
大数据·flink·实时计算·湖仓一体·paimon
Apache Paimon V0.9最新进展摘要:本文整理自 Paimon PMC Chair 李劲松老师在 8 月 3 日 Streaming Lakehouse Meetup Online(Paimon x StarRocks,共话实时湖仓架构)上的分享。主要分享 Apache Paimon V0.9 的最新进展以及遇到的一些挑战。
StarRocks_labs7 个月前
大数据·数据库·数据分析·flink·数据湖·湖仓一体·paimon
StarRocks Lakehouse 快速入门——Apache PaimonStarRocks Lakehouse 快速入门指南为您提供了湖仓技术概览,旨在帮助您迅速掌握其核心特性、独特优势和应用场景。本指南将指导您如何高效地利用 StarRocks 构建解决方案。文章末尾,我们集合了来自阿里云、饿了么、喜马拉雅和同程旅行等行业领导者在 StarRocks x Paimon Streaming Lakehouse 活动中的实战经验分享。通过这些真实案例,您可以更直观地了解如何在实际应用中发挥 StarRocks Lakehouse 的最佳效用。希望这些实践能启发您在自己的项目中应
SelectDB技术团队8 个月前
数据库·iceberg·doris·湖仓一体·lakehouse
Apache Doris + Iceberg 快速搭建指南|Lakehouse 使用手册(三)湖仓一体(Data Lakehouse)融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势,能够更加便捷地满足各种数据处理分析的需求。Apache Doris 持续加深与数据湖的融合,已演进出一套成熟的湖仓一体解决方案。我们将通过一系列文章介绍 Apache Doris 与各类主流数据湖格式及存储系统的湖仓一体架构搭建指南,包括 Hudi、Paimon、Iceberg、OSS、Delta Lake、Kudu、BigQuery 等。
isNotNullX8 个月前
大数据·数据仓库·spark·数据湖·湖仓一体·数据网格
一文详解数据仓库、数据湖、湖仓一体和数据网格数据仓库是传统的数据存储方式,其核心概念是将不同来源的数据抽取、转化和加载到一个中心化的存储系统中,供企业进行决策分析使用。数据仓库通过预定义的模式和结构化的数据模型,使得数据易于理解和查询分析。如果企业有明确的分析要求,并且数据结构稳定且易于理解,数据仓库是一个不错的选择。