目录
-
- [第5章 联机分析处理技术](#第5章 联机分析处理技术)
第5章 联机分析处理技术
作业题
1、在 OLAP 的5个特征 FASMI 中,哪两个是 OLAP 的关键特性?
OLAP 的5个特征 FASMI 包括快速性、分析性、共享性、多维性和信息性。其中快速性和多维性就是 OLAP 系统的两个关键特性。在线性表现为对用户请求的快速响应和交互操作,它是通过使用 C/S 或 B/S 应用结构实现的;多维性通过建立多维数据模型实现对数据的多维分析,是 OLAP 技术的关键所在。
2、多维数据分析有哪几个基本分析操作?
OLAP 的多维分析操作包括对多维数据集的切片(slice)、切块(dice)、下钻(drill-down)、上卷(roll-up)、旋转(pivot)等数据分析方法,以便让用户能从多个角度、多个侧面观察数据,从而深入地了解包含在数据中的有用信息,以支持企业的决策。
3、简述多维数据集"切片"(slice)操作的含义,并举例说明切片操作的结果。
多维数据集中的 "切片" 操作是指在 n(≥3) 维数据集的某一维上,指定一个维成员的选择操作称为切片(Slice)操作,其结果称为 n(≥3) 维数据集的一个切片。若对一个 n 维数据集进行切片操作,则将得到一个 n-1 维的数据集。多维数据集的维度越高,人们对其理解就越困难。切片操作是对多维数据集进行降维处理,可以按照需要选择数据集中的某一部分,方便用户理解多维数据蕴藏的决策信息。
例
举例来说,假设我们有一个3维数据集,分别是:日期、商品类别和销售额。我们可以通过切片操作选择某个特定日期的销售数据,或者选择某个商品类别在所有日期上的销售数据,或者选择某个日期下某个商品类别的销售数据。
具体示例: 假设有以下3维数据集:
- 日期维度:2024年1月1日至2024年1月31日
- 商品类别维度:电子产品、服装、食品
- 销售额数据
如果我们进行如下切片操作: ① 选择日期为2024年1月15日; ② 选择商品类别为电子产品
那么切片操作的结果就是获取2024年1月15日的电子产品销售额数据,即可得到在2024年1月15日这一天销售的电子产品的销售额信息。
这样的切片操作能够帮助我们针对特定条件下的数据进行分析和挖掘,从而更好地理解数据集的特征和趋势。
4、简述多维数据集"下钻"(drill down)操作的含义,并举例说明下钻操作的结果。
对多维数据选定的维度成员,按照其下层次维度对数据进行分解的操作称为下钻(drill down)操作,简称下钻。从由当前的汇总数据深入到其下一层次的细节数据,以便用户观察到更为细粒度的数据。通过下钻操作,可以深入了解数据的具体细节,探索数据背后的更加具体和详尽的信息。
例
举例来说,假设我们有一个包含不同地区、不同产品类别和销售额的多维数据集。在进行下钻操作时,我们可以从总体的地区销售额数据逐步细化到某个具体地区的各个产品类别的销售额数据,以获取更为详细和具体的信息。
具体示例: 假设有以下3维数据集:
- 地区维度:华东、华南、华北
- 产品类别维度:电子产品、服装、食品
- 销售额数据
如果我们进行如下下钻操作:① 首先查看总体销售额数据;② 然后选择 "华南" 地区进行下钻操作;③ 进一步查看 "华南" 地区各个产品类别的销售额数据
那么下钻操作的结果就是从整体销售额数据逐步深入到 "华南" 地区各个产品类别的销售额数据,帮助我们更清晰地了解在"华南"地区各个产品类别的销售情况。
通过下钻操作,我们可以逐步深入到数据的细节层次,发现隐藏在数据背后的更为具体和有用的信息,从而做出更准确和有效的决策。
5、简述多维数据集"上卷"(roll up)操作的含义,并举例说明上卷操作的结果。
对多维数据选定的维度成员,按照其上层次维度对数据进行求和计算并展示的操作称为上卷(roll up)操作,简称上卷。它是在某一个维度上,将低层次的细节数据概括为高层次的汇总数据,以增大数据的粒度,并减少了数据单元格的个数或数据的维度。通过上卷操作,可以将数据从较为具体的细分层次进行合并,以获取更为整体和总体的信息。
例
举例来说,假设我们有一个包含年度、季度、月份和销售额的多维数据集。在进行上卷操作时,我们可以将数据从月份级别进行合并,得到季度或者年度的总体销售额数据,从而获得更为宏观和整体的信息。
具体示例: 假设有以下4维数据集:
- 年度维度:2024年、2025年
- 季度维度:第一季度、第二季度、第三季度、第四季度
- 月份维度:1月、2月、3月、...、12月
- 销售额数据
如果我们进行如下上卷操作:① 首先查看各个月份的销售额数据;② 然后将数据上卷到季度级别,得到各个季度的销售额数据;③ 进一步将数据上卷到年度级别,得到每年的销售额数据
那么上卷操作的结果就是将数据从月份级别逐步合并到季度和年度级别,帮助我们获取更为整体和总体的销售额信息。
通过上卷操作,我们可以将较为详细的数据聚合到更高层次的总体数据,从而更好地理解数据的整体趋势和特征,为决策提供更全面的参考。
6、简述多维数据集"切块"(dice)操作的含义,并举例说明切块操作的结果。
在 n(≥3) 维数据集的某一维上指定若干维成员的选择操作称为切块(Dice)操作,其结果称为n维数据集一个切块。对于 n(≥3) 维数据集,如果某一维上指定的维度成员数大于等于2,则切块操作的结果仍然是一个n维数据集,仅当指定一个维度成员时,其切块操作的结果是一个切片。即切片是切块的特殊情况。通过切块操作,可以针对特定的维度或者组合条件,从数据集中提取符合条件的数据子集,以便更加精确地分析和理解数据。
例
举例来说,假设我们有一个包含不同地区、不同产品类别、不同时间维度(年、月)和销售额的多维数据集。在进行切块操作时,我们可以根据特定的条件选择符合要求的数据子集,以便专注于特定的数据分析需求。
具体示例: 假设有以下4维数据集:
- 地区维度:华东、华南、华北
- 产品类别维度:电子产品、服装、食品
- 时间维度:年、月
- 销售额数据
如果我们进行如下切块操作:① 选择 "华东" 地区和 "电子产品" 类别;② 选择 "2023年" 查看符合以上条件的销售额数据
那么切块操作的结果就是提取出符合 "华东地区"、"电子产品" 类别和 "2023年" 这些条件的数据子集,从而专注于这个特定的数据子集进行分析和探索。
通过切块操作,我们可以根据具体的分析需求选择特定的数据子集,以便更加深入地了解数据的特定方面,发现其中的规律和趋势,为决策提供更准确和有效的支持。