10-Hadoop组件开发技术

单选题

题目1:下列选项描述错误的是?

选项:

A Hadoop HA即集群中包含Secondary NameNode作为备份节点存在。

B ResourceManager负责的是整个Yarn集群资源的监控、分配和管理工作

C NodeManager负责定时的向ResourceManager汇报所在节点的资源使用情况以及接收并处理来自ApplicationMaster的启动停止容器(Container)的各种请求。

D 初次启动Hadoop HA集群时,需要将格式化文件系统后的目录拷贝至另外一台NameNode节点上。

答案:A


题目2:下列选项中那些是Hadoop2.x版本独有的进程

选项:

A JobTracker

B TaskTracker

C NodeManager

D NameNode

答案:C


题目3:下面哪些操作可以设置一个监听器Wacther

选项:

A getData

B getChildren

C exists

D setData

答案:D


题目4:Hadoop2.x版本中的数据块大小默认是多少?

选项:

A 64M

B 128M

C 256M

D 512M

答案:B


题目5:下列描述说法错误的是?

选项:

A SecureCRT是一款支持SSH的终端仿真程序,它能够在Windows操作系统上远程连接Linux服务器执行操作。

B Hadoop是一个用于处理大数据的分布式集群架构,支持在GNU/Linux系统以及Windows系统上进行安装使用。

C VMware Workstation是一款虚拟计算机的软件,用户可以在单一的桌面上同时操作不同的操作系统。

D SSH是一个软件,专为远程登录会话和其他网络服务提供安全性功能的软件。

答案:D


题目6:下面哪项是Hadoop的作者?

选项:

A Martin Fowler

B Doug cutting

C Mark Elliot Zuckerberg

D Kent Beck

答案:B


题目7:Hadoop中数据块的默认的副本数是

选项:

A 1

B 2

C 3

D 4

答案:C


题目8:下列关于Hadoop API的说法错误的是

选项:

A Hadoop的文件API不是通用的,只用于HDFS文件系统

B Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的

C FileStatus对象存储文件和目录的元数据

D FSDataInputStream是java.io.DataInputStream的子类

答案:A


题目9:下列哪项通常是集群的最主要瓶颈

选项:

A CPU

B 网络

C 磁盘IO

D 内存

答案:C


题目10:下面哪个是Hadoop配置文件

选项:

A core-site.xml

B hdfs-site.xml

C yarn-site.xml

D 以上均是

答案:D


多选题

题目1:Zookeeper是一个很好的集群管理工具,被大量用于分布式计算,它主要提供什么服务?

选项:

A 配置维护

B 域名服务

C 分布式同步

D 组服务

答案:ABCD


题目2:数据节点(DataNode)的主要功能包括哪些?

选项:

A 负责数据的存储和读取

B 根据客户端或者是名称节点的调度来进行数据的存储和检索

C 向名称节点定期发送自己所存储的块的列表

D 用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间

答案:ABC


题目3:下列哪一项不属于Hadoop的特性?

选项:

A 较低可扩展性

B 只支持java语言

C 成本低

D 运行在Linux平台上

答案:AB


题目4:下列关于Hadoop的描述,哪些是错误的?

选项:

A 为用户提供了系统顶层分布式基础架构

B 具有较差的跨平台特性

C 可以部署在廉价的计算机集群中

D 被公认为行业大数据标准开源软件

答案:AB


题目5:Hadoop集群的整体性能主要受到什么因素影响?

选项:

A CPU性能

B 内存

C 网络

D 存储容量

答案:ABCD


题目6:以下哪项可用于将参数传递到Pig脚本? 选择所有符合条件的。

选项:

A 命令行参数

B 参数文件

C JSON

D 网页服务

答案:AB


判断题

题目1:伪分布式模式下的Hadoop功能与完全分布式模式下的Hadoop功能相同。

选项:

答案:正确


题目2:Hadoop是Java语言开发的,因此在搭建Hadoop集群时,需要为集群安装JDK环境变量。

选项:

答案:正确


题目3:Hadoop是由Java语言开发的。

选项:

答案:正确


题目4:在Hadoop1.x版本中,MapReduce程序是运行在Yarn集群之上。

选项:

答案:错误


题目5:在Hadoop集群中,NameNode负责管理所有DataNode。

选项:

答案:正确


题目6:Cloudera CDH是需要付费使用的。

选项:

答案:错误


相关推荐
明达技术1 小时前
物联优化汽车齿轮锻造
分布式·物联网
Dreams°1232 小时前
大数据 ETL + Flume 数据清洗 — 详细教程及实例(附常见问题及解决方案)
大数据·单元测试·可用性测试
sf_www2 小时前
Flink on YARN是如何确定TaskManager个数的
大数据·flink
武子康3 小时前
大数据-213 数据挖掘 机器学习理论 - KMeans Python 实现 距离计算函数 质心函数 聚类函数
大数据·人工智能·python·机器学习·数据挖掘·scikit-learn·kmeans
武子康3 小时前
大数据-214 数据挖掘 机器学习理论 - KMeans Python 实现 算法验证 sklearn n_clusters labels
大数据·人工智能·python·深度学习·算法·机器学习·数据挖掘
龙哥·三年风水3 小时前
群控系统服务端开发模式-应用开发-前端框架
分布式·vue·群控系统
Aloudata4 小时前
NoETL自动化指标平台为数据分析提质增效,驱动业务决策
大数据·数据分析·指标平台·指标体系
2401_883041088 小时前
新锐品牌电商代运营公司都有哪些?
大数据·人工智能
青云交8 小时前
大数据新视界 -- 大数据大厂之 Impala 性能优化:融合机器学习的未来之路(上 (2-1))(11/30)
大数据·计算资源·应用案例·数据交互·impala 性能优化·机器学习融合·行业拓展
Json_1817901448011 小时前
An In-depth Look into the 1688 Product Details Data API Interface
大数据·json