hadoop分布式系统复习题 选择题

1、以下哪一项不属于 Hadoop 可以运行的模式?

互联模式
2、下面哪个程序负责 HDFS 数据存储?

Datanode
3、HDFS 中的 block 默认保存__3 _份。
4、配置Hadoop时,JAVA_HOME包含在哪一个配置文件中

hadoop-env.sh
5、 Hadoop fs中的-get和-put命令操作对象是 文件和目录。
6、(多选)以下关于文件块的说法正确的是?( ABCD )

A 、文件的所有 Block 为了容错都会被冗余复制。

B 、除了最后一个 Block ,所有的Block都是同样的大小。

C 、每个文件的 Block 大小和复制( Replication )因子都是可配置的。

D 、 HDFS 将文件存储成块序列。
7、下列哪项通常是集群的最主要瓶受颈?( C )

A 、 CPU B 、网络 C 、磁盘IO D内存
8、 HDFs 是基于流数据模式访问和处理起大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是( D )

A 、一次写入,少次读

B 、多次写入,少次读

C 、多次写入,多次读

D 、一次写入,多次读
9、关于 HDFS 集群中的 DataNode 的描述不正确的是? A

A 一个 DataNode 上存储的所有数据块可以有相同的

B 、存储客户端上传的数据的数据块

C 、 DataNode 之间可以互相通信

D 、响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑
10、当前大数据技术的基础是由( C )首先提出的。

A 、微软

B 、百度

C 、谷歌

D 、阿里巴巴
11、以下说法不正确的是( A )

A 、 HDFS 既适合超大数据集存储.也适合小数据集的存储。

B 、 Hadoop 无法高效的对大量小文件进行存储。

C 、 HDFS 为海量的数据提供了存储,而 MapReduce 为海量的数据提供了计算。

D 、 HDFS 有高容错性的特点,并且设计用来部署在低廉的(low- cost )硬件上。
12、 MapReduce 计算模型的描述,错误的是(C)

A 、 MapReduce 采用的是一种分而治之的思想~

B 、 MapReduce 要求待处理数据集可以分解为能并行处理的小数据集+

C 、 MapReduce 适合于实时在线任务的应用场景

D 、 MapReduce 可以处理离线任务
13、 MapReduce 的一个基本设计思想是? D

A 、提高数据的串行计算速度

B、提高数据冗余度

C 、数据向计算靠拢

D、计算向数据靠拢
14、下面说法错误的是( B )

A 、 MapReduce 框架采用了 Master/Slave 架构,包括一个Master和若开个Slave 。

B 、 Hadoop 框架是用 Java 实现的, MapReduce 应用程序则定要用 Java 来写。

C 、不同的 Map 任务之间不能互相通信。

D 、 Map 函数将输入的元素转换成 <key . value >式的键值对。
15、 YARN是负责集群资源调度管理的组件。不同的计算框架运行在 YARN 框架之上,具有优点( ABCD )

A 、计算资源按需伸缩

B 、共享底层存储,避免数据跨集群迁移。

C 、不同负载应用混搭,集群利用率高

D 、大大降低了运维成本
16、 HBase依赖___D____提供强大的计算能力。

A. Zookeeper

B. Chubby

C. RPC

D. MapReduce
17、客户端是通过( C )级寻址来定位Region。

A.二

B.四

C.三

D.一
18、(多选) MapReduce 与 HBase 的关系,哪些描述是正确的(BC)

A 、两者不可或缺, MapReduce 是 HBase 可以正伟行的保证。

B 、两者不是强关联关系,没有 MapRechiod , HBase可以正常运行。

C . MapReduce 可以直接访问 HBase 。

D 、它们之间没有任何关系。

相关推荐
2501_941623325 小时前
人工智能赋能智慧农业互联网应用:智能种植、农业数据分析与产量优化实践探索》
大数据·人工智能
YangYang9YangYan6 小时前
网络安全专业职业能力认证发展路径指南
大数据·人工智能·安全·web安全
小五传输7 小时前
常用的文件摆渡系统:让数据安全高效跨越网络界限
大数据·运维·安全
数据科学小丫9 小时前
数据分析与FineBI介绍
大数据·数据分析·finebi
ALex_zry9 小时前
Git大型仓库推送失败问题完整解决方案
大数据·git·elasticsearch
二进制coder10 小时前
Git Fork 开发全流程教程
大数据·git·elasticsearch
天硕国产存储技术站14 小时前
DualPLP 双重掉电保护赋能 天硕工业级SSD筑牢关键领域安全存储方案
大数据·人工智能·安全·固态硬盘
雷文成.思泉软件14 小时前
以ERP为核心、企微为门户,实现一体化集成
大数据·低代码·创业创新
东哥说-MES|从入门到精通16 小时前
数字化部分内容 | 十四五年规划和2035年远景目标纲要(新华社正式版)
大数据·人工智能·数字化转型·mes·数字化工厂·2035·十四五规划
南飞测绘视界17 小时前
上市公司绿色专利申请、授权数据(1999-2024年)
大数据·专利·上市公司