数据仓库、大数据平台和数据中台都是指什么

1、物流仓库到数据仓库

数据:对某一类实体信息的描述

仓库:对所有实体的集中化管理

这是物流仓库

下面是数据仓库

ODS层:采集各个业务系统的数据,是数据的统一入口,在这里进行分析并不影响业务系统(起到保存历史数据的作用)。

DWD层:类似物流仓库的分拣层,存储已经清洗的数据(跨业务的数据)。

DWS层:类似物流仓库的仓储区,数据分类(业务划分)存储。

APP层:类似物流仓库的配货区,对数据做专题分析。

元数据库:管理整个数据仓库,保存数据源、数据库表结构,保存清洗规则和标准。数据仓库的数据管理策略都保存在元数据库。

这是一个实际的数仓示意图:

2、大数据平台

下面是一个大数据平台示意图:

3、数据中台

是一个拥有所有开发工具和开发环境的集成系统。

就好像Spring家族的框架逐步统一了JavaWeb的开发环境一样,数据中台就是数据仓库+大数据平台+标准统一的环境支持。

比如在数据仓库,ETL是一个外部功能,而中台把ETL集成在系统内。

中台的特点:

  • 统一技术环境:集合如大数据技术(hadoop,hive)、前后端框架、数据库等,避免技术选型以及重复性环境配置,可复用性高。
  • 数据处理过程产品化:封装数据仓库中的数据操作细节,业务人员也可以通过暴露的功能进行简单的数据分析操作(整合数据汇聚、数据处理、数据可视化等功能)。
  • 统一数据规范:统一数据标准,比如对手机号的校验,中台会提供一个统一的入口。
  • 统一数据管理:如系统权限。

4、业务系统和数据系统

这是一个业务系统

业务系统注重数据的实时性,而数据系统注重数据的分析,一般采用历史数据,得出的分析结论要实时反哺到业务系统,从而更好地支持业务工作。比如根据历史数据实时分析计算客户征信等级,当需要给某客户办理贷款额度的时候就可以调用数据系统的结果,这就是数据系统反哺业务的一个例子。

OLAP (Online Transaction Processing 在线分析处理)和OLTP(Online Analytical Processing 在线事务处理)的区别示意图:

相关推荐
武子康21 小时前
大数据-242 离线数仓 - DataX 实战:MySQL 全量/增量导入 HDFS + Hive 分区(离线数仓 ODS
大数据·后端·apache hive
SelectDB2 天前
易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
大数据·agent·mcp
武子康2 天前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes2 天前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康3 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
字节跳动数据平台4 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康4 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
字节跳动数据平台5 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术5 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康5 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive