数据仓库、大数据平台和数据中台都是指什么

1、物流仓库到数据仓库

数据:对某一类实体信息的描述

仓库:对所有实体的集中化管理

这是物流仓库

下面是数据仓库

ODS层:采集各个业务系统的数据,是数据的统一入口,在这里进行分析并不影响业务系统(起到保存历史数据的作用)。

DWD层:类似物流仓库的分拣层,存储已经清洗的数据(跨业务的数据)。

DWS层:类似物流仓库的仓储区,数据分类(业务划分)存储。

APP层:类似物流仓库的配货区,对数据做专题分析。

元数据库:管理整个数据仓库,保存数据源、数据库表结构,保存清洗规则和标准。数据仓库的数据管理策略都保存在元数据库。

这是一个实际的数仓示意图:

2、大数据平台

下面是一个大数据平台示意图:

3、数据中台

是一个拥有所有开发工具和开发环境的集成系统。

就好像Spring家族的框架逐步统一了JavaWeb的开发环境一样,数据中台就是数据仓库+大数据平台+标准统一的环境支持。

比如在数据仓库,ETL是一个外部功能,而中台把ETL集成在系统内。

中台的特点:

  • 统一技术环境:集合如大数据技术(hadoop,hive)、前后端框架、数据库等,避免技术选型以及重复性环境配置,可复用性高。
  • 数据处理过程产品化:封装数据仓库中的数据操作细节,业务人员也可以通过暴露的功能进行简单的数据分析操作(整合数据汇聚、数据处理、数据可视化等功能)。
  • 统一数据规范:统一数据标准,比如对手机号的校验,中台会提供一个统一的入口。
  • 统一数据管理:如系统权限。

4、业务系统和数据系统

这是一个业务系统

业务系统注重数据的实时性,而数据系统注重数据的分析,一般采用历史数据,得出的分析结论要实时反哺到业务系统,从而更好地支持业务工作。比如根据历史数据实时分析计算客户征信等级,当需要给某客户办理贷款额度的时候就可以调用数据系统的结果,这就是数据系统反哺业务的一个例子。

OLAP (Online Transaction Processing 在线分析处理)和OLTP(Online Analytical Processing 在线事务处理)的区别示意图:

相关推荐
时序数据说5 小时前
国内时序数据库概览
大数据·数据库·物联网·时序数据库·iotdb
阿Paul果奶ooo7 小时前
Flink中基于时间的合流--双流联结(join)
大数据·flink
数据爬坡ing7 小时前
过程设计工具深度解析-软件工程之详细设计(补充篇)
大数据·数据结构·算法·apache·软件工程·软件构建·设计语言
计算机源码社9 小时前
分享一个基于Hadoop的二手房销售签约数据分析与可视化系统,基于Python可视化的二手房销售数据分析平台
大数据·hadoop·python·数据分析·毕业设计项目·毕业设计源码·计算机毕设选题
Direction_Wind10 小时前
Flinksql bug: Heartbeat of TaskManager with id container_XXX timed out.
大数据·flink·bug
计算机毕设残哥10 小时前
完整技术栈分享:基于Hadoop+Spark的在线教育投融资大数据可视化分析系统
大数据·hadoop·python·信息可视化·spark·计算机毕设·计算机毕业设计
轻流AI12 小时前
线索转化率翻3倍?AI重构CRM
大数据·人工智能·低代码·重构
Kay_Liang13 小时前
从聚合到透视:SQL 窗口函数的系统解读
大数据·数据库·sql·mysql·数据分析·窗口函数
武子康14 小时前
大数据-69 Kafka 存储结构解析:日志文件与索引文件的内部机制
大数据·后端·kafka
萤丰信息21 小时前
智慧工地从工具叠加到全要素重构的核心引擎
java·大数据·人工智能·重构·智慧城市·智慧工地