数据仓库的概念

先用大白话讲一下,数据仓库的主要目的就是存储和分析大量结构化数据的。

> 那么它的核心目的是:支持商业智能(BI)和决策支持系统,也就是说,它不仅仅是为了存储,更重要的是为了分析提供便利。

> 再来说下它的特点:面向主题的、集成的、相对稳定的、随时间变化的。而这些特点恰恰反应了数据仓库与传统数据库的区别。

> 这里就要先讲一下OLTP(联机事务处理)OLAP(联机分析处理)的区别

> 1.数据更新:OLTP系统的数据经常被更新,数据仓库的数据相对稳定,通常只定期加载。

> 2.数据模型:OLTP系统通常使用高度规范化的模型;数据仓库通常使用星型或雪花模型

> 3.查询类型:OLTP系统主要处理简单、标准化的查询;数仓用于处理复杂的分析查询。

> 4.数据范围:OLTP系统通常只保存当前的数据;数仓会保存历史的数据。

> 5.性能优化:OLTP系统优化的是写入性能;数仓优化的是读取和分析性能。

> 还有一点,数仓通常会保存多个源系统的数据。

> 举个例子总结下:

> 如果说传统数据库像是一个高效运转的工厂,那么数据仓库就像是一个大型的研究中心,存储、整理并分析大量的信息,为企业决策提供支持。

数据仓库的概念

数据仓库是一个为支持商业智能和决策分析而设计的大型数据存储和管理系统。

数据仓库和传统数据库的区别

|------|------------|-----------------|
| | OLTP | OLAP |
| 用途 | 联机事务处理 | 联机分析处理 |
| 数据更新 | 频繁更新 | 相对稳定,定期加载 |
| 数据模型 | 高度规范化 | 星型或者雪花模型,优化查询性能 |
| 查询类型 | 处理简单标准化的查询 | 处理复杂的分析查询 |
| 数据范围 | 只保存当前数据 | 保存大量的历史数据 |
| 性能优化 | 优化写入性能 | 优化读取和分析性能 |
| 数据整合 | 单一 | 整合来自多个源系统的数据 |

相关推荐
数据要素X1 分钟前
寻梦数据空间 | 架构篇:从概念到落地的技术实践与突破性创新
大数据·运维·数据仓库·微服务·数据治理·数据中台·可信数据空间
玉石观沧海20 分钟前
高压变频器故障代码解析F67 F68
运维·经验分享·笔记·分布式·深度学习
小马爱打代码1 小时前
分布式锁:原理算法和使用建议
分布式·算法
IT学长编程1 小时前
计算机毕业设计 基于EChants的海洋气象数据可视化平台设计与实现 Python 大数据毕业设计 Hadoop毕业设计选题【附源码+文档报告+安装调试】
大数据·hadoop·python·毕业设计·课程设计·毕业论文·海洋气象数据可视化平台
呆呆小金人2 小时前
SQL入门: HAVING用法全解析
大数据·数据库·数据仓库·sql·数据库开发·etl·etl工程师
Elastic 中国社区官方博客3 小时前
如何减少 Elasticsearch 集群中的分片数量
大数据·数据库·elasticsearch·搜索引擎·全文检索
一叶飘零_sweeeet3 小时前
从 “黑盒“ 到 “透明“:SkyWalking 实战指南 —— 让微服务问题无所遁形
分布式·微服务·skywalking·分布式链路追踪
知识浅谈4 小时前
Elasticsearch 核心知识点全景解读
大数据·elasticsearch·搜索引擎
武子康4 小时前
大数据-120 - Flink滑动窗口(Sliding Window)详解:原理、应用场景与实现示例 基于时间驱动&基于事件驱动
大数据·后端·flink
Hello.Reader4 小时前
Flink 广播状态(Broadcast State)实战从原理到落地
java·大数据·flink