数据仓库与数据挖掘(第三版)陈文伟思维导图 第四章 数据仓库的决策支持

第四章 数据仓库的决策支持

## 4.1 数据仓库的用户

*

  ### 4.1.1 信息查询者 (业务层面)

  * user

    * 是使用数据仓库的大量用户。

  * 特点

    * 以一种可预测的、重发性的方式使用数据仓库平台。

  * 作用

    * 使用数据仓库能发现目前存在的问题。

  * 方法

    * 创建数据阵列

    * 预连接表格

    * 预聚集数据

    * 聚类数据

*

  ### 4.1.2 知识探索者 (分析决策)

  * user

    * 典型的DM者。

  * 特点

    * 有一个完全不可预测的、非重复性的数据使用模式。

  * 作用

    * 发现问题并找出原因。

  * 方法

    * 创建单独的探索仓库,不影响数据仓库的常规用户。

      * "标识技术"数据压缩,提高数据分析速度。

    * 使用模型帮助决策分析。

    * 采用数据挖掘工具来获取商业知识。
## 4.2 数据仓库的决策支持与决策支持系统

* 数据仓库是一种能够提供重要战略信息,并获得竞争优势的新技术,从而得到迅速的发展。

*

  ### 4.2.1查询与报表

  *

    #### 查询

    * (1)查询定义

      * 理解表结构

    * (2)查询简化

      * 关键在简化DW

    * (3)查询重建

      * 优化(重写)查询语句,提高速度

    * (4)导航的简单性

      * 避免专业术语,多用行业术语

    * (5)查询执行

      * 点击鼠标即可

    * (6)结果显示

      * 最好可视化

    * (7)对聚合的了解

      * 雪花模型,加快检索速度

  *

    #### 报表

    * (1)预格式化报表。

      * 周期性整理,使其清晰

    * (2)参数驱动的预定义报表。

      * 调设参数,尽可能给user开发自由(类似模版)

    * (3)简单的报表开发。

      * user自定义模版

    * (4)公布和订阅。

      * user第一时间看到报表

    * (5)传递选项。

    * (6)多数据操作选项。

    * (7)多种展现方式选项。

      * 自定义,数据可视化

*

  ### 4.2.2 多维分析与原因分析

  *

    #### 1、多维分析

    * 通过多维分析将获得在各种不同维度下的实际商业活动值(如销售量等),特别是他们的变化值和差值,达到辅助决策效果。

  *

    #### 2、原因分析

    * 查找问题出现的原因是一项很重要的决策支持任务。

    * "向下钻取"操作

*

  ### 4.2.3 预测未来

  * 预测未来使决策者了解"将要发生什么"。

  * 数据仓库中存放了大量的历史数据,从历史数据中找出变化规律,将可以用来预测未来。

  * 预测模型

    * 常用回归模型,包括线性回归或非线性回归。

    * 采用聚类模型或分类模型也能达到一定的预测效果。

*

  ### 4.2.4 实时决策

  * "正在发生什么"

  * 建立动态数据仓库(实时数据库),用于支持战术型决策。

  * 如货运,被算法控制的外卖。

*

  ### 4.2.5 自动决策

  * 利用动态数据库自动决策,达到"希望发生什么"。

*

  ### 4.2.6 决策支持系统

  * 针对实际问题,利用分析工具或者编制程序,采用一种或多种组合的决策支持能力,对数据仓库中的数据进行多维分析。

  * 协助企业制定决策增强竞争优势。
## 4.3 数据仓库应用实例

*

  ### 4.3.1 航空公司数据仓库决策支持系统简例

  *

    #### 1. 航空公司数据仓库系统的功能

    * 市场分析

    * 航班分析

    * 班期分析

  *

    #### 2. 数据仓库系统的决策支持

    * 一段时间内某特定市场占有率、同期比较、增长趋势;

    * 各条航线的收益分析;

    * 计划完成情况;

    * 流量、流向分析;

    * 航线上各项生产指标变化趋势的分析;

  *

    #### 3. 决策支持系统简例

    * 总周转量

      * 客运

        * 地区拆分

          * 昆明

            * 机型拆分

              * a

              * b

              * c

              * d

                * 结论:应减少排班。

          * 重庆

      * 货运

  * 从正反两方面来进行多维分析和原因分析,将可以得到更多的辅助决策信息,减少负增长,增大正增长,提高更大利润。

  *

    #### 进行多方面分析的大型决策支持系统,将可以发挥更大的辅助决策效果。

*

  ### 4.3.2 统计业数据仓库系统

*

  ### 4.3.3沃尔玛数据仓库系统

  * 1.商品分组布局

  * 2.降低库存成本

  * 3. 了解销售全局

  * 4、市场分析

  * 5、趋势分析
相关推荐
泰迪智能科技011 小时前
企业数据挖掘平台×DeepSeek强强联合,多种应用场景适用
人工智能·数据挖掘
生信大杂烩1 小时前
Xenium数据分析 | 数据预处理、单细胞降维聚类、细胞类型定义
数据挖掘·数据分析·聚类
神秘打工猴1 小时前
数据仓库为什么要分层
大数据·数据仓库·spark
StableAndCalm11 小时前
什么是hive
数据仓库·hive·hadoop
Python数据分析与机器学习19 小时前
《基于Hadoop的出租车需求预测系统设计与实现》开题报告
大数据·hadoop·分布式·python·算法·数据挖掘·数据分析
码界筑梦坊20 小时前
基于大数据的全国地铁数据可视化分析系统
大数据·信息可视化·数据分析
人大博士的交易之路1 天前
本周行情——20250308
人工智能·数学建模·分类·数据挖掘·量化交易·缠论·缠中说禅
Tom Boom1 天前
1.11.信息系统的分类【DSS】
人工智能·算法·机器学习·职场和发展·分类·数据挖掘·系统架构
精神病不行计算机不上班1 天前
【数据仓库与数据挖掘基础】决策分析
数据仓库·数据挖掘·spark