10-Hadoop组件开发技术

单选题

题目1：下列选项描述错误的是？

选项:

A Hadoop HA即集群中包含Secondary NameNode作为备份节点存在。

B ResourceManager负责的是整个Yarn集群资源的监控、分配和管理工作

C NodeManager负责定时的向ResourceManager汇报所在节点的资源使用情况以及接收并处理来自ApplicationMaster的启动停止容器（Container）的各种请求。

D 初次启动Hadoop HA集群时，需要将格式化文件系统后的目录拷贝至另外一台NameNode节点上。

答案：A

题目2：下列选项中那些是Hadoop2.x版本独有的进程

选项:

A JobTracker

B TaskTracker

C NodeManager

D NameNode

答案：C

题目3：下面哪些操作可以设置一个监听器Wacther

选项:

A getData

B getChildren

C exists

D setData

答案：D

题目4：Hadoop2.x版本中的数据块大小默认是多少？

选项:

A 64M

B 128M

C 256M

D 512M

答案：B

题目5：下列描述说法错误的是？

选项:

A SecureCRT是一款支持SSH的终端仿真程序，它能够在Windows操作系统上远程连接Linux服务器执行操作。

B Hadoop是一个用于处理大数据的分布式集群架构，支持在GNU/Linux系统以及Windows系统上进行安装使用。

C VMware Workstation是一款虚拟计算机的软件，用户可以在单一的桌面上同时操作不同的操作系统。

D SSH是一个软件，专为远程登录会话和其他网络服务提供安全性功能的软件。

答案：D

题目6：下面哪项是Hadoop的作者？

选项:

A Martin Fowler

B Doug cutting

C Mark Elliot Zuckerberg

D Kent Beck

答案：B

题目7：Hadoop中数据块的默认的副本数是

选项:

A 1

B 2

C 3

D 4

答案：C

题目8：下列关于Hadoop API的说法错误的是

选项:

A Hadoop的文件API不是通用的，只用于HDFS文件系统

B Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的

C FileStatus对象存储文件和目录的元数据

D FSDataInputStream是java.io.DataInputStream的子类

答案：A

题目9：下列哪项通常是集群的最主要瓶颈

选项:

A CPU

B 网络

C 磁盘IO

D 内存

答案：C

题目10：下面哪个是Hadoop配置文件

选项:

A core-site.xml

B hdfs-site.xml

C yarn-site.xml

D 以上均是

答案：D

多选题

题目1：Zookeeper是一个很好的集群管理工具，被大量用于分布式计算，它主要提供什么服务？

选项:

A 配置维护

B 域名服务

C 分布式同步

D 组服务

答案：ABCD

题目2：数据节点（DataNode）的主要功能包括哪些？

选项:

A 负责数据的存储和读取

B 根据客户端或者是名称节点的调度来进行数据的存储和检索

C 向名称节点定期发送自己所存储的块的列表

D 用来保存名称节点中对HDFS元数据信息的备份，并减少名称节点重启的时间

答案：ABC

题目3：下列哪一项不属于Hadoop的特性？

选项:

A 较低可扩展性

B 只支持java语言

C 成本低

D 运行在Linux平台上

答案：AB

题目4：下列关于Hadoop的描述，哪些是错误的？

选项:

A 为用户提供了系统顶层分布式基础架构

B 具有较差的跨平台特性

C 可以部署在廉价的计算机集群中

D 被公认为行业大数据标准开源软件

答案：AB

题目5：Hadoop集群的整体性能主要受到什么因素影响？

选项:

A CPU性能

B 内存

C 网络

D 存储容量

答案：ABCD

题目6：以下哪项可用于将参数传递到Pig脚本？选择所有符合条件的。

选项:

A 命令行参数

B 参数文件

C JSON

D 网页服务

答案：AB

判断题

题目1：伪分布式模式下的Hadoop功能与完全分布式模式下的Hadoop功能相同。

选项:

答案：正确

题目2：Hadoop是Java语言开发的，因此在搭建Hadoop集群时，需要为集群安装JDK环境变量。

选项:

答案：正确

题目3：Hadoop是由Java语言开发的。

选项:

答案：正确

题目4：在Hadoop1.x版本中，MapReduce程序是运行在Yarn集群之上。

选项:

答案：错误

题目5：在Hadoop集群中，NameNode负责管理所有DataNode。

选项:

答案：正确

题目6：Cloudera CDH是需要付费使用的。

选项:

答案：错误