2024年软考下半年已经越来越近了,不知道今年备考架构的同学们准备得怎么样了呢?
简答题一直是架构拿分的重点区域,对于许多考生来说,也往往是最具挑战性的部分。今天我就把那些重要的案例简答题类型整理汇总给大家,希望大家能通过这些题掌握正确的答题技巧和吃透那些重要考点,到时候就可以更轻松地应对这一部分考试。
1、某网作为某电视台在互联网上的大型门户入口,某一年成为某奥运会中国大陆地区的特权转播商,独家全程直播了某奥运会全部的赛事,积累了庞大稳定的用户群,这些用户在使用各类服务过程中产生了大量数据,对这些海量数据进行分析与挖掘,将会对节目的传播及商业模式变现起到重要的作用。
该奥运会期间需要对增量数据在当日概览和赛事回顾两个层面上进行分析。
其中,当日概览模块需要秒级刷新直播在线人数、网站的综合浏览量、页面停留时间、视频的播放次数和平均播放时间等千万级数据量的实时信息,而传统的分布式架构采用重新计算的方式分析实时数据,在不扩充以往集群规模的情况下,无法在几秒内分析出重要的信息。
赛事回顾模块需要展现自定义时间段内的历史最高在线人数、逐日播放走势、直播最高在线人数和点播视频排行等海量数据的统计信息,由于该奥运会期间产生的数据通常不需要被经常索引、更新,因此要求采用不可变方式存储所有的历史数据,以保证历史数据的准确性。
问题内容:
【问题1】(11分)
下图1给出了某网奥运会的大数据架构图,请根据下面的(a)~(k)的相关技术;判断这些技术属于架构图的哪个部分,补充完善下图的(1)-(11)的空白处。
(a)Nginx;(b)Hbase;(c)Spark Streaming;(d)Spark;(e)M-R;(f)ETL;(g)MemSQL;(h)HDFS;(i)Sqoop;(j)Flume;(k)kafka
【问题2】(5分)
大数据的架构包括了Lambda架构和Kappa架构,Lambda架构分解为三层:即批处理层、加速层和服务层;Kappa架构不同于Lambda同时计算流计算和批计算并合并视图,Kappa只会通过流计算一条的数据链路计算并产生视图。
请问该系统的大数据架构是基于哪种架构搭建的大数据平台处理奥运会大规模视频网络观看数据。
【问题3】(9分)
结合题干中对当日概览和赛事回顾的功能要求,请用300字以内的文字简要介绍为什么要选择Lambda架构或者Kappa架构来实现该大数据平台。
试题答案:
【问题1】
(1)c
(2)d
(3)e
(4)g
(5)b
(6)h
(7)k
(8)i
(9)j
(10)f
(11)a
【问题2】
该系统的大数据架构是基于Lambda架构搭建的大数据平台处理奥运会大规模视频网络观看数据。
【问题3】
Lambda架构实时处理层(加速层)采用增量计算实时数据的方式,可以在集群规模不变的前提下,秒级分析出当日概览所需要的信息。Lambda架构的批处理层采用不可变存储模型,不断地往主数据集后追加新的数据,恰好可以满足对奥运会数据的大规模统计分析要求。
试题解析:
【问题1】
某网奥运会大数据架构图
【问题2】
大数据的架构包括了Lambda架构和Kappa架构,Lambda架构分解为三层:即批处理层、加速层和服务层;Kappa架构不同于Lambda同时计算流计算和批计算并合并视图,Kappa只会通过流计算一条的数据链路计算并产生视图。
该系统的大数据架构是基于Lambda架构搭建的大数据平台处理奥运会大规模视频网络观看数据。
【问题3】
该奥运会期间需要对增量数据在当日概览和赛事回顾两个层面上进行分析。其中,当日概览模块需要秒级刷新直播在线人数、网站的综合浏览量、页面停留时间、视频的播放次数和平均播放时间等千万级数据量的实时信息,而传统的分布式架构采用重新计算的方式分析实时数据,在不扩充以往集群规模的情况下,无法在几秒内分析出重要的信息。Lambda架构实时处理层采用增量计算实时数据的方式,可以在集群规模不变的前提下,秒级分析出当日概览所需要的信息。
赛事回顾模块需要展现自定义时间段内的历史最高在线人数、逐日播放走势、直播最高在线人数和点播视频排行等海量数据的统计信息,由于该奥运会期间产生的数据通常不需要被经常索引、更新,因此要求采用不可变方式存储所有的历史数据,以保证历史数据的准确性。Lambda架构的批处理层采用不可变存储模型,不断地往主数据集后追加新的数据,恰好可以满足对奥运会数据的大规模统计分析要求。
2、某航空公司希望对构建于上世纪七、八十年代的主要业务系统进行改造与集成,提高企业的竞争力。由于集成过程非常复杂,公司决定首先以Ramp Coordination系统为例进行集成过程的探索与验证。
在航空业中,Ramp Coordination是指飞机从降落到起飞过程中所需要进行的各种业务活动的协调过程。通常每个航班都有一位员工负责Ramp Coordination,称之为Ramp Coordinator。由Ramp Coordinator协调的业务活动包括检查机位环境、卸货和装货等。
由于航班类型、机型的不同,Ramp Coordination的流程有很大差异。图(a)所示的流程主要针对短期中转航班,这类航班在机场稍作停留后就起飞;图(b)所示的流程主要针对到达航班,通常在机场过夜后第二天起飞;图(c)所示的流程主要针对离港航班,这类航班是每天的第一班飞机。这三种类型的航班根据长途/短途、国内/国外等因素还可以进一步细分,每种细分航班类型的Ramp Coordination的流程也略有不同。
Ramp Coordination业务流程
为了完成上述业务,Ramp Coordination信息系统需要从乘务人员管理系统中提取航班乘务员的信息、从订票系统中提取乘客信息、从机务人员管理系统中提取机务人员信息、接收来自航班调度系统的航班到达事件。其中乘务人员管理系统和航班调度系统运行在大型主机系统之上,机务人员管理系统运行在Unix操作系统之上,订票系统基于Java语言,具有Web界面,运行在Linux操作系统之上。
目前Ramp Coordination信息系统主要由人工完成所有协调工作,效率低且容易出错。公司领导要求集成后的Ramp Coordination信息系统能够针对不同需求迅速开展业务流程,灵活、高效地完成协调任务。
针对上述要求,公司IT部门的架构师经过分析与讨论,最终采用面向服务的架构,以服务为中心进行Ramp Coordination信息系统的集成工作。
问题内容:
【问题1】(10分)
服务建模是对Ramp Coordination信息系统进行集成的首要工作,公司的架构师首先对Ramp Coordination信息系统进行服务建模,识别出系统中的两个主要业务服务组件:
(1)Ramp Control:负责Ramp Coordination信息系统中各种相关业务活动的组件;
(2)Flight Management:负责航班相关信息的管理,包括航班日程、乘客信息等。针对上述服务模型,结合题干描述,请为每个业务服务组件提供的服务进行分析与整理,完成表中的空白部分。
......
篇幅有限,有需要PDF完整版或更多资料的朋友,可以自行获取↓↓↓