数据仓库、大数据平台和数据中台都是指什么

1、物流仓库到数据仓库

数据:对某一类实体信息的描述

仓库:对所有实体的集中化管理

这是物流仓库

下面是数据仓库

ODS层:采集各个业务系统的数据,是数据的统一入口,在这里进行分析并不影响业务系统(起到保存历史数据的作用)。

DWD层:类似物流仓库的分拣层,存储已经清洗的数据(跨业务的数据)。

DWS层:类似物流仓库的仓储区,数据分类(业务划分)存储。

APP层:类似物流仓库的配货区,对数据做专题分析。

元数据库:管理整个数据仓库,保存数据源、数据库表结构,保存清洗规则和标准。数据仓库的数据管理策略都保存在元数据库。

这是一个实际的数仓示意图:

2、大数据平台

下面是一个大数据平台示意图:

3、数据中台

是一个拥有所有开发工具和开发环境的集成系统。

就好像Spring家族的框架逐步统一了JavaWeb的开发环境一样,数据中台就是数据仓库+大数据平台+标准统一的环境支持。

比如在数据仓库,ETL是一个外部功能,而中台把ETL集成在系统内。

中台的特点:

  • 统一技术环境:集合如大数据技术(hadoop,hive)、前后端框架、数据库等,避免技术选型以及重复性环境配置,可复用性高。
  • 数据处理过程产品化:封装数据仓库中的数据操作细节,业务人员也可以通过暴露的功能进行简单的数据分析操作(整合数据汇聚、数据处理、数据可视化等功能)。
  • 统一数据规范:统一数据标准,比如对手机号的校验,中台会提供一个统一的入口。
  • 统一数据管理:如系统权限。

4、业务系统和数据系统

这是一个业务系统

业务系统注重数据的实时性,而数据系统注重数据的分析,一般采用历史数据,得出的分析结论要实时反哺到业务系统,从而更好地支持业务工作。比如根据历史数据实时分析计算客户征信等级,当需要给某客户办理贷款额度的时候就可以调用数据系统的结果,这就是数据系统反哺业务的一个例子。

OLAP (Online Transaction Processing 在线分析处理)和OLTP(Online Analytical Processing 在线事务处理)的区别示意图:

相关推荐
Acrel1361196551419 分钟前
别让电能质量问题拖后腿:工业场景中电能治理的战略意义
大数据·人工智能·能源·创业创新
不辉放弃1 小时前
详细讲解pyspark中dsl格式进行大数据开发中的的所有编程情况
大数据·spark
IT研究室1 小时前
大数据毕业设计选题推荐-基于大数据的分化型甲状腺癌复发数据可视化分析系统-Spark-Hadoop-Bigdata
大数据·hadoop·信息可视化·spark·毕业设计·源码·bigdata
zandy10111 小时前
LLM与数据工程的融合:衡石Data Agent的语义层与Agent框架设计
大数据·人工智能·算法·ai·智能体
计算机编程小央姐1 小时前
数据安全成焦点:基于Hadoop+Spark的信用卡诈骗分析系统实战教程
大数据·hadoop·python·spark·毕业设计·课程设计·dash
时序数据说2 小时前
时序数据库IoTDB的六大实用场景盘点
大数据·数据库·物联网·时序数据库·iotdb
阿豪32 小时前
2025 年职场:B 端产品经理用计算机专业技能优化产品全攻略(经验分享)
大数据·人工智能·科技·信息可视化·产品经理
数据智研2 小时前
【数据分享】土地利用矢量shp数据分享-甘肃
大数据·信息可视化
Sui_Network2 小时前
凭借 Seal,Walrus 成为首个具备访问控制的去中心化数据平台
大数据·人工智能·科技·web3·去中心化·区块链
TechubNews2 小时前
Webus 与中国国际航空合作实现 XRP 支付
大数据·网络·人工智能·web3·区块链