数据仓库与数据挖掘(第三版)陈文伟思维导图 第四章 数据仓库的决策支持

第四章 数据仓库的决策支持

## 4.1 数据仓库的用户

*

  ### 4.1.1 信息查询者 (业务层面)

  * user

    * 是使用数据仓库的大量用户。

  * 特点

    * 以一种可预测的、重发性的方式使用数据仓库平台。

  * 作用

    * 使用数据仓库能发现目前存在的问题。

  * 方法

    * 创建数据阵列

    * 预连接表格

    * 预聚集数据

    * 聚类数据

*

  ### 4.1.2 知识探索者 (分析决策)

  * user

    * 典型的DM者。

  * 特点

    * 有一个完全不可预测的、非重复性的数据使用模式。

  * 作用

    * 发现问题并找出原因。

  * 方法

    * 创建单独的探索仓库,不影响数据仓库的常规用户。

      * "标识技术"数据压缩,提高数据分析速度。

    * 使用模型帮助决策分析。

    * 采用数据挖掘工具来获取商业知识。
## 4.2 数据仓库的决策支持与决策支持系统

* 数据仓库是一种能够提供重要战略信息,并获得竞争优势的新技术,从而得到迅速的发展。

*

  ### 4.2.1查询与报表

  *

    #### 查询

    * (1)查询定义

      * 理解表结构

    * (2)查询简化

      * 关键在简化DW

    * (3)查询重建

      * 优化(重写)查询语句,提高速度

    * (4)导航的简单性

      * 避免专业术语,多用行业术语

    * (5)查询执行

      * 点击鼠标即可

    * (6)结果显示

      * 最好可视化

    * (7)对聚合的了解

      * 雪花模型,加快检索速度

  *

    #### 报表

    * (1)预格式化报表。

      * 周期性整理,使其清晰

    * (2)参数驱动的预定义报表。

      * 调设参数,尽可能给user开发自由(类似模版)

    * (3)简单的报表开发。

      * user自定义模版

    * (4)公布和订阅。

      * user第一时间看到报表

    * (5)传递选项。

    * (6)多数据操作选项。

    * (7)多种展现方式选项。

      * 自定义,数据可视化

*

  ### 4.2.2 多维分析与原因分析

  *

    #### 1、多维分析

    * 通过多维分析将获得在各种不同维度下的实际商业活动值(如销售量等),特别是他们的变化值和差值,达到辅助决策效果。

  *

    #### 2、原因分析

    * 查找问题出现的原因是一项很重要的决策支持任务。

    * "向下钻取"操作

*

  ### 4.2.3 预测未来

  * 预测未来使决策者了解"将要发生什么"。

  * 数据仓库中存放了大量的历史数据,从历史数据中找出变化规律,将可以用来预测未来。

  * 预测模型

    * 常用回归模型,包括线性回归或非线性回归。

    * 采用聚类模型或分类模型也能达到一定的预测效果。

*

  ### 4.2.4 实时决策

  * "正在发生什么"

  * 建立动态数据仓库(实时数据库),用于支持战术型决策。

  * 如货运,被算法控制的外卖。

*

  ### 4.2.5 自动决策

  * 利用动态数据库自动决策,达到"希望发生什么"。

*

  ### 4.2.6 决策支持系统

  * 针对实际问题,利用分析工具或者编制程序,采用一种或多种组合的决策支持能力,对数据仓库中的数据进行多维分析。

  * 协助企业制定决策增强竞争优势。
## 4.3 数据仓库应用实例

*

  ### 4.3.1 航空公司数据仓库决策支持系统简例

  *

    #### 1. 航空公司数据仓库系统的功能

    * 市场分析

    * 航班分析

    * 班期分析

  *

    #### 2. 数据仓库系统的决策支持

    * 一段时间内某特定市场占有率、同期比较、增长趋势;

    * 各条航线的收益分析;

    * 计划完成情况;

    * 流量、流向分析;

    * 航线上各项生产指标变化趋势的分析;

  *

    #### 3. 决策支持系统简例

    * 总周转量

      * 客运

        * 地区拆分

          * 昆明

            * 机型拆分

              * a

              * b

              * c

              * d

                * 结论:应减少排班。

          * 重庆

      * 货运

  * 从正反两方面来进行多维分析和原因分析,将可以得到更多的辅助决策信息,减少负增长,增大正增长,提高更大利润。

  *

    #### 进行多方面分析的大型决策支持系统,将可以发挥更大的辅助决策效果。

*

  ### 4.3.2 统计业数据仓库系统

*

  ### 4.3.3沃尔玛数据仓库系统

  * 1.商品分组布局

  * 2.降低库存成本

  * 3. 了解销售全局

  * 4、市场分析

  * 5、趋势分析
相关推荐
艾派森12 分钟前
大数据分析案例-基于随机森林算法的智能手机价格预测模型
人工智能·python·随机森林·机器学习·数据挖掘
苍老流年3 小时前
Hive中各种Join的实现
数据仓库·hive·hadoop
EDG Zmjjkk5 小时前
Hive 查询(详细实操版)
数据仓库·hive·hadoop
武子康5 小时前
大数据-212 数据挖掘 机器学习理论 - 无监督学习算法 KMeans 基本原理 簇内误差平方和
大数据·人工智能·学习·算法·机器学习·数据挖掘
Q8137574605 小时前
数据挖掘在金融交易中的应用:民锋科技的智能化布局
人工智能·科技·数据挖掘
布说在见5 小时前
魅力标签云,奇幻词云图 —— 数据可视化新境界
信息可视化·数据挖掘·数据分析
Hsu_kk6 小时前
Hive 查询各类型专利 Top 10 申请人及对应的专利申请数
数据仓库·hive·hadoop
大数据编程之光6 小时前
Hive 查询各类型专利 top10 申请人及专利申请数
大数据·数据仓库·hive·hadoop
杰克逊的日记6 小时前
Hive详解
数据仓库·hive·hadoop
千汇数据的老司机7 小时前
webGIS在可视化大屏中的应用场景有哪些,有哪些类库
信息可视化·webgis·#web