【Hive】——数据仓库

那时的样子_2023-12-10 14:38

1.1 数仓概念

数据仓库（data warehouse）：是一个用于存储，分析，报告的数据系统

目的：是构建面向分析的集成化数据环境，分析结果为企业提供决策支持

特点：

数据仓库本身不产生任何数据，其数据来源于不同外部系统

数据仓库也不需要消费任何的书，其结果开放给各个外部应用使用

这也是为什么叫仓库，而不叫工厂的原因

1.2 案例

1.3 数仓特征

1.3.1 面向主题性

1.3.2 集成性

1.3.3 非易性、非异变性

1.3.4 时变性

1.4 OLTP、OLAP

1.4.1 OLTP：联机事务处理

1.4.2 OLAP：联机分析处理

1.4.3 OLAP对比OLTP

1.5 数据仓库、数据库的区别

1.6 数据仓库、数据集市的区别

1.7 数据仓库思想与架构

1.7.1 分层思想和标准

操作型数据层（ODS）

数据仓库层（DW）

数据应用层（DA）

1.7.2 ODS层（Operation Data Store）

1.7.2 DW层（Data Warehouse）

1.7.3 DA层（或ADS层）

1.8 分层作用

1.9 ETL、ELT

ETL：抽取Extra、转化Transfer、装载Load

具体顺序基于业务实际灵活选择

1.9.1 ETL

1.9.2 ELT

上一篇：一个js小组件，了解js面向对象编程

下一篇：小程序建立用户与数据的联系问题解决方案

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04AI科技热点日报 | 2026年07月01日 05国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 09微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 102026 年 AI 大模型 & AI 编程工具实战全总结