第八届传智杯AI云计算大数据开发挑战赛练习题库(三)

2.[单选]

复制代码
大数据的4V特征不包括以下哪一项(  )

( 1分 )

得分:0分

Volume(大量)

Variety(多样)

Value(价值)

Visual(可视)未选

正确答案Visual(可视)

答案解析大数据4V特征为Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值),不包含Visual(可视)。

3.[单选]

复制代码
云计算中,PaaS为用户提供(  )

( 1分 )

得分:0分

硬件资源

操作系统、开发环境等平台资源未选

应用程序

数据存储服务

正确答案操作系统、开发环境等平台资源

答案解析PaaS为用户提供操作系统、开发环境等平台资源。

4.[单选]

复制代码
以下哪种技术不属于大数据采集技术(  )

( 1分 )

得分:0分

网络爬虫

日志采集工具Flume

ETL工具

Hadoop未选

正确答案Hadoop

答案解析网络爬虫、Flume、ETL工具都可用于大数据采集。Hadoop是一个分布式系统基础架构,主要用于数据存储与处理,并非采集技术。

5.[单选]

复制代码
以下哪种数据库属于非关系型数据库(  )

( 1分 )

得分:0分

Oracle

SQL Server

MongoDB未选

PostgreSQL

正确答案MongoDB

答案解析MongoDB是非关系型文档数据库。

6.[单选]

复制代码
以下哪个不是大数据分析的常用算法(  )

( 1分 )

得分:0分

决策树

线性回归

冒泡排序未选

聚类算法

正确答案冒泡排序

答案解析决策树、线性回归、聚类算法都常用于大数据分析。冒泡排序是简单排序算法,主要用于小规模数据排序。

7.[单选]

复制代码
云计算的快速弹性指的是(  )

( 1分 )

得分:0分

资源不能动态调整

资源可以快速、弹性地扩展和收缩未选

资源扩展和收缩速度很慢

资源只能扩展不能收缩

正确答案资源可以快速、弹性地扩展和收缩

答案解析快速弹性指云资源可快速、弹性扩展和收缩以适应业务需求变化。

8.[单选]

复制代码
在大数据处理中,ETL是指(  )

( 1分 )

得分:0分

抽取、转换、加载未选

加密、解密、传输

采集、清洗、分析

存储、查询、展示

正确答案抽取、转换、加载

答案解析ETL即Extract(抽取)、Transform(转换)、Load(加载)。

9.[单选]

复制代码
以下哪种数据库适合存储海量结构化数据(  )

( 1分 )

得分:0分

MySQL

Redis

MongoDB

HBase未选

正确答案HBase

答案解析HBase是基于Hadoop的分布式列存储数据库,适合存储海量结构化数据。MySQL处理大规模数据能力有限;Redis是缓存数据库,主要存储键值对;MongoDB是文档型数据库,适合非结构化数据。

10.[单选]

复制代码
云计算的可计量服务特性是指(  )

( 1分 )

得分:0分

服务不可计量

按使用量对资源进行监控和计费未选

资源使用量固定

计费方式不透明

正确答案按使用量对资源进行监控和计费

答案解析可计量服务指云服务提供商按用户使用量对资源监控和计费。

11.[单选]

复制代码
大数据可视化的主要目的是(  )

( 1分 )

得分:0分

让数据更难理解

隐藏数据中的信息

更直观展示数据信息未选

增加数据量

正确答案更直观展示数据信息

答案解析大数据可视化通过图形等方式将数据直观展示,便于理解数据信息。

12.[单选]

复制代码
云计算按服务模式分类,不包括以下哪种(  )

( 1分 )

得分:0分

IaaS

PaaS

DaaS未选

SaaS

正确答案DaaS

答案解析云计算按服务模式分为IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务),DaaS(数据即服务)不属于此分类常见类型。

13.[单选]

复制代码
以下哪个工具常用于大数据的批处理(  )

( 1分 )

得分:0分

Storm

Spark Streaming

Flink

MapReduce未选

正确答案MapReduce

答案解析MapReduce是Hadoop中用于大数据批处理的计算框架。

14.[单选]

复制代码
以下哪个是云计算的特点(  )

( 1分 )

得分:0分

高成本

资源不可共享

可扩展性未选

数据不可备份

正确答案可扩展性

答案解析云计算具有低成本、资源共享、可扩展性强、数据可备份等特点。

15.[单选]

复制代码
以下哪种数据格式不属于大数据常见格式(  )

( 1分 )

得分:0分

CSV

JSON

XML

EXE未选

正确答案EXE

答案解析CSV、JSON、XML都是大数据常见数据格式。EXE是可执行文件格式,不是数据格式。

16.[单选]

复制代码
在大数据分析中,数据预处理不包括以下哪项(  )

( 1分 )

得分:0分

数据集成

数据标准化

数据建模未选

数据缺失值处理

正确答案数据建模

答案解析数据建模是数据分析后续步骤,不属于预处理。

17.[单选]

复制代码
大数据的价值密度特点是(  )

( 1分 )

得分:0分

低未选

固定不变

与数据量无关

正确答案低

答案解析大数据虽然数据量庞大,但有价值的信息相对较少,价值密度低。

18.[单选]

复制代码
在云计算中,多租户技术是指(  )

( 1分 )

得分:0分

多个用户使用不同的资源

多个用户共享相同的资源实例未选

一个用户使用多个资源实例

一个用户使用一个资源实例

正确答案多个用户共享相同的资源实例

答案解析多租户技术指多个用户可以共享相同的资源实例,这些用户在隔离的环境下使用资源。

19.[单选]

复制代码
以下哪种技术用于大数据的实时流处理(  )

( 1分 )

得分:0分

MapReduce

Hive

Storm未选

Pig

正确答案Storm

答案解析Storm是专门用于大数据实时流处理的框架。

20.[单选]

复制代码
在大数据领域,数据挖掘主要是(  )

( 1分 )

得分:0分

从大量数据中发现有价值信息未选

对数据进行备份

对数据进行传输

对数据进行加密

正确答案从大量数据中发现有价值信息

答案解析数据挖掘就是从海量数据中挖掘出有价值信息。

21.[单选]

复制代码
云计算的按需自助服务特性意味着(  )

( 1分 )

得分:0分

用户需等待服务商分配资源

用户可以自动获取所需资源未选

资源只能由服务商分配

资源获取需经过复杂审批

正确答案用户可以自动获取所需资源

答案解析按需自助服务指用户可自动获取所需计算资源。

22.[单选]

复制代码
云计算的资源池化是指(  )

( 1分 )

得分:0分

将资源分散管理

将不同类型资源整合到一起统一管理和分配未选

只对一种资源进行管理

资源只能被一个用户使用

正确答案将不同类型资源整合到一起统一管理和分配

答案解析资源池化是把不同类型资源整合,统一管理和分配给多个用户。

23.[单选]

复制代码
以下哪种云部署模式适合对数据安全和隐私要求极高的企业(  )

( 1分 )

得分:0分

公有云

私有云未选

混合云

社区云

正确答案私有云

答案解析私有云为企业构建专属云环境,数据安全性和隐私性高。

24.[单选]

复制代码
在云计算中,以下哪个负责资源的调度和管理(  )

( 1分 )

得分:0分

云操作系统未选

云存储

云网络

云安全

正确答案云操作系统

答案解析云操作系统负责云计算资源的调度和管理。

25.[单选]

复制代码
以下哪个工具用于在Hadoop与关系型数据库间传输数据(  )

( 1分 )

得分:0分

Flume

Sqoop未选

Kafka

Zookeeper

正确答案Sqoop

答案解析Sqoop用于在Hadoop与关系型数据库间传输数据。

26.[单选]

复制代码
大数据的高速特征指的是(  )

( 1分 )

得分:0分

数据传输速度快

数据处理速度快

数据产生速度快

以上都是未选

正确答案以上都是

答案解析大数据高速特征体现在数据产生、传输、处理速度都快。

27.[单选]

复制代码
云计算中,IaaS是指(  )

( 1分 )

得分:0分

软件即服务

平台即服务

基础设施即服务未选

数据即服务

正确答案基础设施即服务

答案解析IaaS即基础设施即服务,提供如服务器、存储等基础计算资源。软件即服务是SaaS;平台即服务是PaaS;数据即服务表述不准确。

28.[单选]

复制代码
大数据分析的基本步骤不包括(  )

( 1分 )

得分:0分

数据采集

数据清洗

数据可视化

数据加密未选

正确答案数据加密

答案解析大数据分析基本步骤包括数据采集、数据清洗、数据可视化等。数据加密主要用于数据安全保护,不属于分析基本步骤。

29.[单选]

复制代码
云计算中的SLA是指(  )

( 1分 )

得分:0分

服务级别协议未选

安全级别协议

存储级别协议

应用级别协议

正确答案服务级别协议

答案解析SLA即服务级别协议,规定云服务提供商与用户间的服务标准和责任。

30.[单选]

复制代码
以下哪种云服务模式用户只需使用应用程序(  )

( 1分 )

得分:0分

IaaS

PaaS

SaaS未选

DaaS

正确答案SaaS

答案解析SaaS用户通过浏览器等使用提供商提供的应用程序。

31.[单选]

复制代码
以下哪种云部署模式结合了公有云与私有云的优点(  )

( 1分 )

得分:0分

公有云

私有云

混合云未选

社区云

正确答案混合云

答案解析混合云结合了公有云成本低和私有云安全性高的优点。

32.[单选]

复制代码
在大数据分析中,以下哪种算法属于分类算法(  )

( 1分 )

得分:0分

K - Means

Apriori

Naive Bayes未选

PageRank

正确答案Naive Bayes

答案解析Naive Bayes是分类算法。

33.[单选]

复制代码
以下哪种技术用于大数据的分布式协调(  )

( 1分 )

得分:0分

Hadoop

Zookeeper未选

Spark

Hive

正确答案Zookeeper

答案解析Zookeeper用于大数据的分布式协调,保证分布式系统中数据一致性等。

34.[单选]

复制代码
在大数据处理中,数据清洗的目的是(  )

( 1分 )

得分:0分

增加数据量

去除重复、错误数据未选

对数据进行加密

对数据进行分类

正确答案去除重复、错误数据

答案解析数据清洗主要是去除重复、错误、不完整等脏数据,提高数据质量。

35.[单选]

复制代码
以下哪个是公有云的优点(  )

( 1分 )

得分:0分

安全性极高

成本低未选

定制性强

数据隐私保护最好

正确答案成本低

答案解析公有云多用户共享资源,成本低。

36.[单选]

复制代码
在云计算中,用户通过(  )使用云服务

( 1分 )

得分:0分

本地服务器

浏览器或客户端软件未选

移动硬盘

光盘

正确答案浏览器或客户端软件

答案解析用户通常通过浏览器或客户端软件接入云服务。

37.[单选]

复制代码
以下哪种技术用于大数据的分布式存储(  )

( 1分 )

得分:0分

Kafka

Zookeeper

HDFS未选

Sqoop

正确答案HDFS

答案解析HDFS是Hadoop的分布式文件系统,用于大数据分布式存储。

38.[单选]

复制代码
大数据技术栈中,以下哪个用于数据查询和分析(  )

( 1分 )

得分:0分

HDFS

Hive未选

MapReduce

Flume

正确答案Hive

答案解析Hive是基于Hadoop的数据仓库工具,用于数据查询和分析。

39.[单选]

复制代码
以下哪个不是大数据的来源(  )

( 1分 )

得分:0分

传感器

社交网络

书本未选

电商平台

正确答案书本

答案解析书本上的数据需数字化后才可能成为大数据来源。

40.[单选]

复制代码
大数据处理框架Spark的核心数据结构是(  )

( 1分 )

得分:0分

RDD(弹性分布式数据集)未选

DataFrame

Dataset

以上都不是

正确答案RDD(弹性分布式数据集)

答案解析Spark核心数据结构是RDD(弹性分布式数据集)。

41.[单选]

复制代码
Hadoop的核心组件不包括(  )

( 1分 )

得分:0分

HDFS

MapReduce

YARN

Spark未选

正确答案Spark

答案解析Hadoop核心组件有HDFS(分布式文件系统)、MapReduce(分布式计算框架)、YARN(资源管理系统)。Spark是独立于Hadoop的分布式计算框架。

42.[多选]

复制代码
以下哪些是关系型数据库的特点?

( 1分 )

得分:0分

此题已选择 0/4 项

数据以表格形式存储漏选

支持复杂查询漏选

数据冗余度低漏选

适合存储非结构化数据

正确答案数据以表格形式存储、支持复杂查询、数据冗余度低

答案解析关系型数据库数据以表格形式存储,通过SQL支持复杂查询,通过规范化设计降低数据冗余。但它不适合存储非结构化数据,非结构化数据适合用非关系型数据库存储。

43.[多选]

复制代码
以下哪些技术常用于大数据的实时处理?

( 1分 )

得分:0分

此题已选择 0/4 项

Storm漏选

Flink漏选

Spark Streaming漏选

MapReduce

正确答案Storm、Flink、Spark Streaming

答案解析Storm、Flink、Spark Streaming都可用于大数据实时处理。MapReduce主要用于批处理,实时处理能力较弱。

44.[多选]

复制代码
以下哪些属于IaaS提供的资源?

( 1分 )

得分:0分

此题已选择 0/4 项

服务器漏选

存储漏选

网络漏选

操作系统

正确答案服务器、存储、网络

答案解析IaaS提供服务器、存储、网络等基础设施资源,操作系统一般由用户在IaaS提供的资源上自行安装和管理。

45.[多选]

复制代码
大数据采集过程中可能用到的工具和技术有?

( 1分 )

得分:0分

此题已选择 0/4 项

Flume漏选

Sqoop漏选

网络爬虫漏选

Kafka漏选

正确答案Flume、Sqoop、网络爬虫、Kafka

答案解析Flume采集日志等数据,Sqoop在Hadoop与关系型数据库间传输数据,网络爬虫抓取网页数据,Kafka作为消息队列可暂存采集数据,都用于大数据采集。

46.[多选]

复制代码
在云计算中,资源隔离的方法有?

( 1分 )

得分:0分

此题已选择 0/4 项

虚拟化隔离漏选

网络隔离漏选

存储隔离漏选

数据加密

正确答案虚拟化隔离、网络隔离、存储隔离

答案解析虚拟化隔离通过虚拟机实现不同用户资源隔离,网络隔离划分不同网络区域隔离,存储隔离保证不同用户数据存储隔离。数据加密主要用于数据安全保护,非资源隔离方法。

47.[多选]

复制代码
云计算面临的安全挑战包括?

( 1分 )

得分:0分

此题已选择 0/4 项

数据泄露漏选

身份认证与授权问题漏选

虚拟机安全漏选

网络安全漏选

正确答案数据泄露、身份认证与授权问题、虚拟机安全、网络安全

答案解析云计算中数据存储在云端可能泄露,身份认证与授权不当易致非法访问,虚拟机可能存在安全漏洞,网络传输也面临安全威胁。

48.[多选]

复制代码
以下哪些是云计算的服务模型?

( 1分 )

得分:0分

此题已选择 0/4 项

IaaS漏选

PaaS漏选

SaaS漏选

DaaS

正确答案IaaS、PaaS、SaaS

答案解析云计算常见服务模型是IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)。DaaS(数据即服务)不属于主流云计算服务模型。

49.[多选]

复制代码
云计算的资源池化带来的好处有?

( 1分 )

得分:0分

此题已选择 0/4 项

提高资源利用率漏选

降低运营成本漏选

便于资源管理漏选

增强数据安全性

正确答案提高资源利用率、降低运营成本、便于资源管理

答案解析资源池化整合资源,提高利用率,降低运营成本,便于统一管理。但资源池化本身并不直接增强数据安全性,数据安全需其他措施保障。

50.[多选]

复制代码
以下哪些属于非关系型数据库的类型?

( 1分 )

得分:0分

此题已选择 0/4 项

键值存储数据库漏选

文档型数据库漏选

列存储数据库漏选

图数据库漏选

正确答案键值存储数据库、文档型数据库、列存储数据库、图数据库

答案解析键值存储数据库(如Redis)、文档型数据库(如MongoDB)、列存储数据库(如HBase)、图数据库(如Neo4j)都属于非关系型数据库类型。

51.[多选]

复制代码
以下哪些属于云计算的优势?

( 1分 )

得分:0分

此题已选择 0/4 项

降低成本漏选

提高资源利用率漏选

增强数据安全性

方便数据备份漏选

正确答案降低成本、提高资源利用率、方便数据备份

答案解析云计算通过资源共享降低成本,提高资源利用率,并且通常提供便捷的数据备份功能。虽然云计算采取多种安全措施,但相比私有云部署,公有云在数据安全性上并非绝对增强。

52.[多选]

复制代码
大数据分析在以下哪些领域有应用?

( 1分 )

得分:0分

此题已选择 0/4 项

医疗保健漏选

金融服务漏选

电子商务漏选

交通管理漏选

正确答案医疗保健、金融服务、电子商务、交通管理

答案解析医疗保健可分析病例等数据,金融服务用于风险评估等,电子商务分析用户行为,交通管理分析路况数据,大数据分析在这些领域都有应用。

53.[多选]

复制代码
大数据分析中,机器学习算法可用于?

( 1分 )

得分:0分

此题已选择 0/4 项

分类任务漏选

回归任务漏选

聚类任务漏选

关联规则挖掘漏选

正确答案分类任务、回归任务、聚类任务、关联规则挖掘

答案解析机器学习算法广泛应用于大数据分析,分类算法用于分类任务,回归算法用于回归任务,聚类算法用于聚类任务,关联规则挖掘算法用于挖掘数据关联关系。

54.[多选]

复制代码
以下哪些属于大数据存储技术?

( 1分 )

得分:0分

此题已选择 0/4 项

HBase漏选

Cassandra漏选

Redis

MongoDB漏选

正确答案HBase、Cassandra、MongoDB

答案解析HBase、Cassandra是分布式列存储数据库,MongoDB是文档型数据库,都适合大数据存储。Redis主要作为缓存数据库,虽可存储数据,但不是典型大数据存储技术。

55.[多选]

复制代码
大数据技术体系包括?

( 1分 )

得分:0分

此题已选择 0/4 项

数据采集技术漏选

数据存储技术漏选

数据分析技术漏选

数据可视化技术漏选

正确答案数据采集技术、数据存储技术、数据分析技术、数据可视化技术

答案解析大数据技术体系涵盖数据采集、存储、分析、可视化等技术,各环节相互配合处理大数据。

56.[多选]

复制代码
云计算按部署模式可分为?

( 1分 )

得分:0分

此题已选择 0/4 项

公有云漏选

私有云漏选

混合云漏选

社区云漏选

正确答案公有云、私有云、混合云、社区云

答案解析云计算部署模式包括公有云、私有云、混合云、社区云。公有云多用户共享;私有云企业专属;混合云结合两者;社区云供特定社区组织使用。

57.[多选]

复制代码
在云计算中,负载均衡的作用有?

( 1分 )

得分:0分

此题已选择 0/4 项

提高系统可用性漏选

优化资源利用漏选

防止单点故障漏选

加快数据传输速度

正确答案提高系统可用性、优化资源利用、防止单点故障

答案解析负载均衡将请求分配到多个服务器,提高系统可用性,优化资源利用,避免单点故障。但它主要针对服务器请求处理,并非直接加快数据传输速度。

58.[多选]

复制代码
在大数据分析中,数据质量问题可能包括?

( 1分 )

得分:0分

此题已选择 0/4 项

数据缺失漏选

数据重复漏选

数据错误漏选

数据不一致漏选

正确答案数据缺失、数据重复、数据错误、数据不一致

答案解析数据缺失、重复、错误、不一致都会影响数据质量,在大数据分析前需进行处理。

59.[多选]

复制代码
大数据可视化的常见图表类型有?

( 1分 )

得分:0分

此题已选择 0/4 项

柱状图漏选

折线图漏选

饼图漏选

散点图漏选

正确答案柱状图、折线图、饼图、散点图

答案解析柱状图、折线图、饼图、散点图都是大数据可视化中常用图表类型,用于直观展示数据特征和关系。

60.[多选]

复制代码
以下哪些是HDFS的特点?

( 1分 )

得分:0分

此题已选择 0/4 项

高容错性漏选

适合处理小文件

分布式存储漏选

数据多副本存储漏选

正确答案高容错性、分布式存储、数据多副本存储

答案解析HDFS通过数据多副本存储实现高容错性,采用分布式存储方式。但它不适合处理小文件,处理小文件会占用大量元数据空间,降低效率。

61.[多选]

复制代码
大数据的采集来源可能有?

( 1分 )

得分:0分

此题已选择 0/4 项

物联网设备漏选

数据库漏选

社交媒体漏选

日志文件漏选

正确答案物联网设备、数据库、社交媒体、日志文件

答案解析物联网设备产生设备运行数据,数据库存储业务数据,社交媒体有用户交互数据,日志文件记录系统操作等数据,都是大数据采集来源。

62.[多选]

复制代码
云计算中,虚拟机的特点有?

( 1分 )

得分:0分

此题已选择 0/4 项

隔离性漏选

可迁移性漏选

共享物理资源漏选

性能与物理机完全相同

正确答案隔离性、可迁移性、共享物理资源

答案解析虚拟机具有隔离性,不同虚拟机相互隔离;可迁移性,能在不同物理机间迁移;共享物理机资源。但虚拟机性能受物理机资源和虚拟化技术影响,不会与物理机完全相同。

63.[多选]

复制代码
大数据处理流程包括?

( 1分 )

得分:0分

此题已选择 0/4 项

数据采集漏选

数据清洗漏选

数据分析漏选

数据可视化漏选

正确答案数据采集、数据清洗、数据分析、数据可视化

答案解析大数据处理先采集数据,清洗脏数据,分析挖掘价值,最后通过可视化展示结果,这些都是处理流程的环节。

64.[多选]

复制代码
以下哪些属于PaaS提供的服务?

( 1分 )

得分:0分

此题已选择 0/4 项

应用服务器漏选

数据库管理系统漏选

开发框架漏选

硬件服务器

正确答案应用服务器、数据库管理系统、开发框架

答案解析PaaS提供应用服务器、数据库管理系统、开发框架等平台服务。硬件服务器属于IaaS提供的资源。

65.[多选]

复制代码
以下哪些属于大数据的应用场景?

( 1分 )

得分:0分

此题已选择 0/4 项

精准营销漏选

智能交通漏选

天气预报漏选

舆情监测漏选

正确答案精准营销、智能交通、天气预报、舆情监测

答案解析精准营销分析用户数据推送产品,智能交通分析路况优化交通,天气预报分析气象数据,舆情监测分析社交媒体等数据,都是大数据应用场景。

66.[多选]

复制代码
大数据分析中的数据清洗操作可能包括?

( 1分 )

得分:0分

此题已选择 0/4 项

去除重复记录漏选

处理缺失值漏选

纠正错误数据漏选

数据标准化漏选

正确答案去除重复记录、处理缺失值、纠正错误数据、数据标准化

答案解析去除重复记录、处理缺失值、纠正错误数据、数据标准化都是数据清洗常见操作,以提高数据质量。

67.[多选]

复制代码
以下哪些是SaaS的特点?

( 1分 )

得分:0分

此题已选择 0/4 项

多租户漏选

低前期成本漏选

自动软件更新漏选

用户需自行维护服务器

正确答案多租户、低前期成本、自动软件更新

答案解析SaaS采用多租户模式,多个用户共享软件资源,前期成本低,软件由提供商自动更新。用户无需自行维护服务器。

68.[多选]

复制代码
云计算的关键技术包括?

( 1分 )

得分:0分

此题已选择 0/4 项

虚拟化技术漏选

分布式存储技术漏选

分布式计算技术漏选

多租户技术漏选

正确答案虚拟化技术、分布式存储技术、分布式计算技术、多租户技术

答案解析虚拟化技术实现资源隔离与共享,分布式存储技术存储海量数据,分布式计算技术处理大数据,多租户技术支持多用户共享资源,都是云计算关键技术。

69.[多选]

复制代码
以下哪些是Hadoop的优点?

( 1分 )

得分:0分

此题已选择 0/4 项

高可靠性漏选

高扩展性漏选

适合处理大规模数据漏选

实时处理性能强

正确答案高可靠性、高扩展性、适合处理大规模数据

答案解析Hadoop通过数据多副本存储保证高可靠性,采用分布式架构具有高扩展性,能处理大规模数据。但Hadoop主要用于批处理,实时处理性能不强。

70.[多选]

复制代码
大数据分析中常用的数据挖掘算法有?

( 1分 )

得分:0分

此题已选择 0/4 项

决策树算法漏选

关联规则算法漏选

聚类算法漏选

回归分析算法漏选

正确答案决策树算法、关联规则算法、聚类算法、回归分析算法

答案解析决策树用于分类预测,关联规则挖掘数据间关联关系,聚类算法将数据分组,回归分析算法进行数值预测,都是数据挖掘常用算法。

71.[多选]

复制代码
在大数据存储中,列式存储的优点有?

( 1分 )

得分:0分

此题已选择 0/4 项

适合数据压缩漏选

对于查询某一列数据效率高漏选

适合事务处理

数据更新操作快

正确答案适合数据压缩、对于查询某一列数据效率高

答案解析列式存储按列存储数据,适合数据压缩,查询某一列数据时无需读取整行,效率高。但它不适合事务处理,数据更新操作相对复杂且慢。

复制代码
大数据分析中,聚类算法是将数据按照已知类别进行分类。

( 1分 )

得分:0分

错未选

正确答案错

答案解析聚类算法是将数据按照相似性分成不同组,事先不知道类别。分类算法才是按已知类别分类。

复制代码
数据挖掘和大数据分析是完全相同的概念。

( 1分 )

得分:0分

错未选

正确答案错

答案解析数据挖掘是大数据分析的一部分,大数据分析还包括数据采集、清洗、可视化等更多环节。

复制代码
PaaS模式下,用户无需关心底层硬件资源。

( 1分 )

得分:0分

对未选

正确答案对

答案解析PaaS提供平台资源,用户专注应用开发,无需关心底层硬件。

复制代码
云计算中的 IaaS 为用户提供操作系统、数据库等软件层面的服务

( 1分 )

得分:0分

错未选

正确答案错

答案解析IaaS 提供底层基础设施服务,PaaS 提供平台级服务

复制代码
在大数据处理中,ETL工具主要用于数据的实时处理。

( 1分 )

得分:0分

错未选

正确答案错

答案解析ETL主要用于数据抽取、转换和加载,常用于批处理,非实时处理。

复制代码
数据清洗是大数据分析中可有可无的步骤。

( 1分 )

得分:0分

错未选

正确答案错

答案解析数据清洗去除脏数据,提高数据质量,对大数据分析结果准确性很重要,不是可有可无。

复制代码
在 Hadoop 生态中,YARN 可协调多种计算框架共享集群资源

( 1分 )

得分:0分

对未选

正确答案对

答案解析负责资源管理和任务调度

复制代码
容器化技术相比虚拟化技术,启动快、资源占用少

( 1分 )

得分:0分

对未选

正确答案对

答案解析直接共享宿主内核,无需模拟完整系统

复制代码
IaaS服务提供商负责管理和维护用户在云平台上安装的应用程序。

( 1分 )

得分:0分

错未选

正确答案错

答案解析IaaS提供基础设施,应用程序由用户自行管理和维护。

复制代码
Spark Streaming 适合对实时性要求不高的场景

( 1分 )

得分:0分

对未选

正确答案对

答案解析其秒级延迟,不如 Flink 适合高频交易等实时性高的场景

复制代码
云计算的核心特征包括按需自助服务、广泛的网络访问、资源池化、快速弹性伸缩和可计量服务

( 1分 )

得分:0分

对未选

正确答案对

答案解析这是 NIST 定义的云计算五大核心特征

复制代码
数据脱敏不会保留数据的可用性

( 1分 )

得分:0分

错未选

正确答案错

答案解析数据脱敏在保护隐私同时保留数据可用性用于测试、分析

复制代码
大数据可视化只是为了让数据展示更美观,对数据分析没有实际帮助。

( 1分 )

得分:0分

错未选

正确答案错

答案解析大数据可视化能直观展示数据信息,帮助分析人员理解数据,发现规律和问题,对数据分析有重要帮助。

复制代码
大数据分析结果必然正确,因基于海量数据

( 1分 )

得分:0分

错未选

正确答案错

答案解析大数据分析可靠性受数据质量、算法、逻辑等多因素影响

复制代码
大数据分析的结果一定是准确无误的。

( 1分 )

得分:0分

错未选

正确答案错

答案解析大数据分析结果受数据质量、分析方法等多种因素影响,不一定准确无误。

复制代码
数据脱敏不能保护数据隐私

( 1分 )

得分:0分

错未选

正确答案错

答案解析数据脱敏可防止敏感信息泄露,保护隐私

复制代码
Spark 处理速度比 MapReduce 快是因完全摒弃磁盘 IO

( 1分 )

得分:0分

错未选

正确答案错

答案解析Spark 数据超内存会用磁盘,靠内存复用等提速度

复制代码
在云计算中,多租户技术会降低资源的安全性。

( 1分 )

得分:0分

错未选

正确答案错

答案解析通过合理的安全措施,如资源隔离等,多租户技术不会必然降低资源安全性。

复制代码
大数据的高速特征主要指数据传输速度快。

( 1分 )

得分:0分

错未选

正确答案错

答案解析大数据高速特征包括数据产生、传输、处理速度都快。

复制代码
数据可视化可以帮助非技术人员更好地理解大数据分析结果。

( 1分 )

得分:0分

对未选

正确答案对

答案解析数据可视化以直观图形展示数据,便于非技术人员理解分析结果。

复制代码
云计算的可扩展性意味着企业可以根据业务需求随时增加或减少资源。

( 1分 )

得分:0分

错错选

正确答案对

答案解析可扩展性是云计算特点,企业能按需增减资源。

复制代码
大数据分析不需要考虑数据质量

( 1分 )

得分:0分

错未选

正确答案错

答案解析数据质量影响大数据分析结果的可靠性

复制代码
Kafka 适合在大数据场景中实现系统解耦和数据缓冲

( 1分 )

得分:0分

对未选

正确答案对

答案解析高吞吐量,可持久化存储消息

复制代码
在大数据处理中,数据加密属于数据预处理步骤。

( 1分 )

得分:0分

错未选

正确答案错

答案解析数据加密主要用于数据安全保护,不属于数据预处理提高数据质量的范畴。

复制代码
IaaS模式下,用户需要自己构建操作系统和应用程序环境。

( 1分 )

得分:0分

对未选

正确答案对

答案解析IaaS提供基础设施资源,操作系统和应用程序环境需用户自行构建。

复制代码
云存储服务不具备高扩展性

( 1分 )

得分:0分

错未选

正确答案错

答案解析云存储无需提前规划容量,可随数据量增长自动扩容

复制代码
SaaS模式下,用户需要自行维护和管理软件。

( 1分 )

得分:0分

错未选

正确答案错

答案解析SaaS模式下,软件由提供商维护和管理,用户通过浏览器等使用软件。

复制代码
公有云环境下,不同用户的资源是完全隔离的,不会相互影响。

( 1分 )

得分:0分

错未选

正确答案错

答案解析虽然公有云采用资源隔离技术,但仍可能存在一些安全漏洞或配置不当导致相互影响。

复制代码
Flink 采用微批处理模式进行数据处理

( 1分 )

得分:0分

错未选

正确答案错

答案解析Flink 采用事件驱动模式,Spark Streaming 采用微批处理模式

复制代码
云服务器相比传统物理服务器,适合业务量波动较大的场景

( 1分 )

得分:0分

对未选

正确答案对

答案解析有快速部署、弹性扩容、按使用付费等优势

相关推荐
田里的水稻6 小时前
AD_车辆运动无模型横向控制_纯跟踪(PP,Pure Pursuit)
人工智能·自动驾驶
淬炼之火6 小时前
图文跨模态融合基础 2 :LLM工程总览
人工智能·语言模型·自然语言处理
咕噜企业分发小米6 小时前
腾讯云IM与TRTC集成时,如何优化用户体验?
云计算·腾讯云
【赫兹威客】浩哥6 小时前
【赫兹威客】伪分布式Flink测试教程
大数据·分布式·flink
胡西风_foxww6 小时前
学习python人工智能路径及资源
人工智能·python·学习·路径·资源·书籍·路线
@––––––6 小时前
论文阅读笔记:The Bitter Lesson (苦涩的教训)
论文阅读·人工智能·笔记
weixin_462446236 小时前
【Dify 实战】基于 Workflow + LLM 的智能语音合成(TTS)完整教程(支持情感 / 语速 / 自动语言)
人工智能·语音识别·coze·mcp
乾元6 小时前
社交工程 2.0:生成式 AI 驱动的高拟真钓鱼与认知对抗
网络·人工智能·安全·机器学习·架构
数字会议深科技6 小时前
开放会场 / 封闭空间双兼容:同传系统的场景化解决方案革新
人工智能·翻译·政务·同声传译·会议系统品牌·会议解决方案·超大型会议
Katecat996636 小时前
棉花质量检测与分类:基于YOLOv26的智能识别系统_2
人工智能·yolo