Hadoop面试题汇总

2019-08-30 11:29

单选题

1.下面哪个程序负责 HDFS 数据存储。

a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker 答案C datanode

2. HDfS 中的 block 默认保存几份?

a)3 份 b)2 份c)1 份d)不确定 答案A默认3分

3. 下列哪个程序通常与 NameNode 在一个节点启动?

a)SecondaryNameNode b)DataNode c)TaskTracker d)Jobtracker 答案D

4. Hadoop 作者

a)Martin Fowler b)Kent Beck c)Doug cutting 答案C Doug cutting

5. HDFS 默认 Block Size

a)32MB b)64MB c)128MB

答案:1.X版本是64M

2.X版本是128M

6.下列哪项通常是集群的最主要瓶颈

a)CPU b)网络 c)磁盘IO d)内存 答案:C磁盘

7.Doug Cutting所创立的项目的名称都受到其家人的启发,以下项目不是由他创立的项目是

A. Hadoop B. Nutch

C. Lucene D. Solr 答案:D

8.配置Hadoop时,JAVA_HOME包含在哪一个配置文件中

A. hadoop-default.xml B. hadoop-env.sh C. hadoop-site.xml D. configuration.xsl 答案:B

9. Hadoop配置文件中,hadoop-site.xml显示覆盖hadoop-default.xml里的内容。在版本0.20中,hadoop-site.xml被分离成三个XML文件,不包括

A. conf-site.xml B. mapred-site.xml C. core-site.xml D. hdfs-site.xml 答案:A

10.HDFS默认的当前工作目录是/user/$USER,fs.default.name的值需要在哪个配置文件内说明

A. mapred-site.xml B. core-site.xml C. hdfs-site.xml D. 以上均不是 答案:B

11.关于Hadoop单机模式和伪分布式模式的说法,正确是

A.两者都起守护进程,且守护进程运行在一台机器上 B.单机模式不使用HDFS,但加载守护进程 C.两者都不与守护进程交互,避免复杂性

D.后者比前者增加了HDFS输入输出以及可检查内存使用情况 答案:D

12.下列关于Hadoop API的说法错误的是

A. Hadoop的文件API不是通用的,只用于HDFS文件系统

B. Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的 C. FileStatus对象存储文件和目录的元数据

D. FSDataInputStream是java.io.DataInputStream的子类 答案:A

13.HDFS的NameNode负责管理文件系统的命名空间,将所有的文件和文件夹的元数据保存在一个文件系统树中,这些信息也会在硬盘上保存成以下文件:

A.日志

B.命名空间镜像 C.两者都是 答案:C

14.HDFS的namenode保存了一个文件包括哪些数据块,分布在哪些数据节点上,这些信息也存储在硬盘上。

A.正确 B.错误 答案:B

知识点:在系统启动的时候从数据节点收集而成的

15.Secondary namenode就是namenode出现问题时的备用节点

A.正确 B.错误 答案:B 知识点:它和元数据节点负责不同的事情。其主要功能就是周期性将元数据节点的命名空间镜像文件和修改日志合并,以防日志文件过大。合并过后的命名空间镜像文件也在Secondary namenode保存了一份,以防namenode失败的时候,可以恢复。

16.HDFS的是基于流数据模式访问和处理超大文件的需求而开发的,默认的最基本的存储单位是64M,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是

A.一次写入,少次读写 B.多次写入,少次读写 C.一次写入,多次读写 D.多次写入,多次读写 答案:C

17.HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括

A.利用SequenceFile、MapFile、Har等方式归档小文件 B.多Master设计

C. Block大小适当调小

D.调大namenode内存或将文件系统元数据存到硬盘里 答案:D

18.关于HDFS的文件写入,正确的是

A.支持多用户对同一文件的写操作 B.用户可以在文件任意位置进行修改 C.默认将文件块复制成三份存放

D.复制的文件块默认都存在同一机架上 答案:C

19.Hadoop fs中的-get和-put命令操作对象是

A.文件 B.目录 C.两者都是 答案:C

20.Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是

A.安全模式目的是在系统启动时检查各个DataNode上数据块的有效性 B.根据策略对数据块进行必要的复制或删除

C.当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式 D.文件系统允许有修改 答案:D

21.下列关于HDFS为存储MapReduce并行切分和处理的数

据做的设计,错误的是

A. FSDataInputStream扩展了DataInputStream以支持随机读 B. 为实现细粒度并行,输入分片(Input Split)应该越小越好 C. 一台机器可能被指派从输入文件的任意位置开始处理一个分片

D. 输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割 答案:B

多选题

1. 关于 SecondaryNameNode 哪项是正确的?

a)它是 NameNode 的热备 b)它对内存没有要求

c)它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间 d)SecondaryNameNode 应与 NameNode 部署到一个节点 答案C D

2. 下列哪项可以作为集群的管理?

a)Puppet b)Pdsh c)Cloudera Manager d)Zookeeper 答案1:ABC

3. 配置机架感知的下面哪项正确

a)如果一个机架出问题,不会影响数据读写

b)写入数据的时候会写到不同机架的 DataNode 中

c)MapReduce 会根据机架获取离自己比较近的网络数据 答案ABC

具体可以参考

hadoop机架感知--加强集群稳固性,该如何配置hadoop机架感知

4. Client 端上传文件的时候下列哪项正确

a)数据经过 NameNode 传递给 DataNode b)Client 端将文件切分为 Block,依次上传

c)Client 只上传数据到一台 DataNode,然后由 NameNode 负责 Block 复制工作


Hadoop面试题汇总.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:surfer软件的使用方法

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: