阿里云生态离线数仓

1. 大数据开发治理平台 DataWorks

功能齐全:10多年大数据建设沉淀完整的平台,覆盖数据开发治理的全生命周期
简单易用:全图形化界面,SQL为主的数据开发方式
安全稳定:双11日千万级任务稳定调度,金融级数据安全保障
开放兼容: 支持多种大数据引擎绑定,开放OpenAPI定制化对接能力

2. 大数据计算服务 MaxCompute

2.1 云原生,极致弹性,总体拥有成本低

云原生设计,无服务器架构,支持秒级弹性伸缩,快速实现大规模弹性负载需求
按作业计费,不使用不收费,相比自建 IDC 综合成本只需1/5

2.2 简单易用的多功能计算服务

预置多种计算模型和数据通道能力,开通即用
通过联合计算平台,支持多套引擎
联邦计算支持 Hadoop 数据源的融合计算

2.3 领先的智能化计算服务

智能化数据冷存,实现自动数据存储分级
智能计算优化,大幅降低人工调优成本

2.4 完善的企业级平台服务

承诺99.9%可用性 SLA

支持开放生态,提供企业级安全管理能力。与阿里云众多大数据服务无缝集成

3. 基于阿里云DataWorks&MaxCompute搭建数据仓库(离线)

|------------|--------------|------------------------------------------------------------|
| 阿里云产品 | 简介 | 类比开源框架 |
| DataWorks | 大数据开发治理平台,存储 | DataX/Cana//DolphinScheduler AirFlow/Azkaban/Atlas/Griffin |
| RDS | 关系型数据库,采集 | MySql |
| QuickBl | 可视化数据展示工具,展示 | Tableau、Echarts、Kibana |
| MaxCompute | 云原生大数据计算服务 | Hadoop+Hive+调度器 |

4. 数据仓库

数据仓库定义 (Data Warehouse)是为企业所有决策制定过程,提供所有系统数据支持的战略集合。

数据仓库VS传统数据库存储三大优势:

(1) 体量大,效率高

(2) 历史追查,时光回溯

(3) 数据可用性强

5. 系统数据流程设计

事实表:介绍业务流程本身,一个动作 -> 明细数据层

维度表:时间地点人物,表述业务流程的环境 -> 公共维度层

7. DataWorks和MaxCompute

++DataWorks++ 基于阿里云++MaxCompute/Hologres/EMR/CDP++ 等大数据引擎,为++数据仓库/数据湖/湖仓一体++ 等解决方案提供统一的++全链路大数据开发治理平台++。作为阿里巴巴数据中台的建设者,DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。

++MaxCompute++是面向分析的企业级 SaaS 模式云数据仓库,以 Serverless 架构提供快速、全托管的++在线数据仓库服务++ ,消除了传统数据平台在++资源扩展性和弹性++方面的限制,最小化用户运维投入,使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析,将数据高效转换为业务洞察。
盘古:相当于Hadoop中的HDFS

伏羲:相当于Hadoop中的YARN

MaxCompute Engine:相当于MR、Tez等计算引擎

MaxCompute和DataWorks一起向用户提供完善的ETL和数仓管理能力,以及SQL、MR、Graph等多种经典的分布式计算模型,能够更快速地解决用户海量数据计算问题,有效降低企业成本,保障数据安全。

相关推荐
云雾J视界7 小时前
Flink Checkpoint与反压问题排查手册:从日志分析到根因定位
大数据·阿里云·flink·linq·checkpoint·反压
你的大佬9997 小时前
阿里云百炼ai模型
人工智能·阿里云·云计算
一只栖枝8 小时前
备考华为HCIA - 云计算,培训与自学到底该怎么选?
云计算·华为认证·hcia·考证·职业规划
数据与人工智能律师14 小时前
AI的法治迷宫:技术层、模型层、应用层的法律痛点
大数据·网络·人工智能·云计算·区块链
荣光波比1 天前
Docker(三)—— Docker Compose 编排与 Harbor 私有仓库实战指南
运维·docker·容器·云计算
企鹅侠客1 天前
mysqldump导入备份数据到阿里云RDS会报错吗
阿里云·adb·云计算
iHero1 天前
【Jitsi Meet】阿里云Docker安装Jitsi Meet后的调整
阿里云·docker·云计算
荣光波比1 天前
Ansible(三)—— 使用Ansible自动化部署LNMP环境实战指南
运维·自动化·云计算·ansible
荣光波比1 天前
Docker(五)—— Docker Compose 一键搭建 LNMP 架构并部署 WordPress
运维·docker·容器·云计算
mjhcsp2 天前
深入解析 IDM 插件开发挑战赛:技术要点与实践指南
服务器·阿里云·云计算