数据仓库理论知识

m0_681439762024-09-07 10:50

1、数据仓库的概念

数据仓库（英文：Date Warehouse，简称数仓、DW），是一个用于数据存储、分析、报告的数据系统。数据仓库的建设目的是面向分析的集成化数据环境，其数据来源于不同的外部系统，其结果开放给不同外部应用使用，为企业提供决策支持；

2、数据仓库的主要特征

数据仓库是面向主题性 （Subject-Oriented ）、集成性 （Integrated）、非易失性 （Non-Volatile）和时变性（Time-Variant ）数据集合，用以支持管理决策。

3、数据库和数据仓库的区别：

数据源：数据库的数据仅包含当前运行的日常业务数据，而数据仓库的数据是整合了多个外部系统的数据包括OLTP。
目的：数据库的建设目的面向应用、面向业务、支持事务，而数据据仓库的建设是面向主题、面向分析、支持决策的
焦点：数据库关注的数据焦点是当下，而数据仓库则是面向过去、面向历史、实时数仓。
任务：数据库存在读写操作，而数据仓库是大量的读数据而很少有写操作。
响应时间：数据库是毫秒级别，数据仓库库秒、分钟、小时或则天，主要取决于数据量和查询的复杂度。
数据量：数据库小数据，MB、GB级别的，而数据仓库则是大数据TB、PB级别

数据仓库不是大型的数据库，虽然数据仓库存储数据规模大。
数据仓库的出现，并不是要取代数据库。
数据库是面向事务的设计，数据仓库是面向主题设计的。
数据库一般存储业务数据，数据仓库存储的一般是历史数据。
数据库是为捕获数据而设计，数据仓库是为分析数据而设计

4、数据仓库、数据集市

数据仓库是面对整个集团和组织的数据，而数据集是面向单个部门使用的，可以认为数据集市是数据仓库的子集。用户可以基于主题数据开展各种应用：数据分析、数据报表、数据挖掘。

5、数据仓库分层架构

详解-ODS-DWD-DWS-ADS

上一篇：企业微信hook协议接口，聚合群聊客户管理工具开发

下一篇：Echart 柱形图相同项提取复用

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？092026 年 AI 大模型 & AI 编程工具实战全总结 10【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……