单选题

1/18.
下列传统并行计算框架,说法错误的是哪一项?

  • A.刀片服务器、高速网、SAN,价格贵,扩展性差上
  • B.共享式(共享内存/共享存储),容错性好
  • C.编程难度高
  • D.实时、细粒度计算、计算密集型

image.png
2/18.
下列关于MapReduce模型的描述,错误的是哪一项?

  • A.MapReduce采用“ 分而治之”策略
  • B.MapReduce设计的一个理念就是“ 计算向数据靠拢”
  • C.MapReduce框架采用了Master/Slave架构
  • D.MapReduce应用程序只能用Java来写

image.png
3/18.
MapReduce1.0的体系结构中,JobTracker是主要任务是什么?

  • A.负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况
  • B.使用“slot”等量划分本节点上的资源量(CPU、内存等)
  • C.会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给TaskTracker
  • D.会跟踪任务的执行进度、资源使用量等信息,并将这些信息告诉任务(Task)

image.png
image.png
image.png

4/18.
下列关于MapReduce工作流程,哪个描述是正确的?

  • A.所有的数据交换都是通过MapReduce框架自身去实现的
  • B.不同的Map任务之间会进行通信
  • C.不同的Reduce任务之间可以发生信息交换
  • D.用户可以显式地从一台机器向另一台机器发送消息

image.png
5/18.
下列关于MapReduce的说法,哪个描述是错误的?

  • A.MapReduce具有广泛的应用,比如关系代数运算、分组与聚合运算等
  • B.MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数
  • C.编程人员在不会分布式并行编程的情况下,也可以很容易将自己的程序运行在分布式系统上,完成海量数据集的计算
  • D.不同的Map任务之间可以进行通信

image.pngimage.pngimage.png
6/18.
下列关于Map和Reduce函数的描述,哪个是错误的?

  • A.Map将小数据集进一步解析成一批对,输入Map函数中进行处理
  • B.Map每一个输入的会输出一批是计算的中间结果
  • C.Reduce输入的中间结果中的List(v 2 )表示是一批属于不同k 2 的value
  • D.Reduce输入的中间结果中的List(v 2 )表示是一批属于同一个k 2 的value

image.png
7/18.
下面哪一项不是MapReduce体系结构主要部分?

  • A.Client
  • B.JobTracker
  • C.TaskTracker以及Task
  • D.Job

image.png
PS:很多参考答案都显示选A,但我不理解
image.png
8/18.
关于MapReduce1.0的体系结构的描述,下列说法错误的是?

  • A.Task 分为Map Task 和Reduce Task 两种,分别由JobTracker 和TaskTracker 启动
  • B.slot 分为Map slot 和Reduce slot 两种,分别供MapTask 和Reduce Task 使用
  • C.TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等)
  • D.TaskTracker 会周期性接收JobTracker 发送过来的命令并执行相应的操作(如启动新任务、杀死任务等)

image.png
9/18.
下列说法错误的是?

  • A.Hadoop MapReduce是MapReduce的开源实现,后者比前者使用门槛低很多
  • B.MapReduce采用非共享式架构,容错性好
  • C.MapReduce主要用于批处理、实时、计算密集型应用
  • D.MapReduce采用“ 分而治之”策略

image.png
image.pngimage.png


多选题

10/18.
MapReduce相较于传统的并行计算框架有什么优势?

  • A.非共享式,容错性好
  • B.普通PC机,便宜,扩展性好
  • C.编程简单,只要告诉MapReduce做什么即可
  • D.批处理、非实时、数据密集型

image.png
11/18.
MapReduce体系结构主要由以下那几个部分构成?

  • A.Client
  • B.JobTracker
  • C.TaskTracker
  • D.Task

image.png
12/18.
下列关于MapReduce的体系结构的描述,说法正确的有?

  • A.用户编写的MapReduce程序通过Client提交到JobTracker端
  • B.JobTracker负责资源监控和作业调度
  • C.TaskTracker监控所有TaskTracker与Job的健康状况
  • D.TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等)

image.pngimage.png
13/18.
MapReduce的作业主要包括什么?

  • A.从磁盘或从网络读取数据,即IO密集工作
  • B.计算数据,即CPU密集工作
  • C.针对不同的工作节点选择合适硬件类型
  • D.负责协调集群中的数据存储

image.png
14/18.
对于MapReduce 而言,其处理单位是split。split 是一个逻辑概念,它包含哪些元数据信息?

  • A.数据起始位置
  • B.数据长度
  • C.数据所在节点
  • D.数据大小

image.png
PS:是参考答案不用心还是时代变了
image.png
15/18.
下列关于Map 端的Shuffle的描述,哪些是正确的?

  • A.MapReduce默认为每个Map任务分配1000MB缓存
  • B.多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的
  • C.当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce
  • D.每个Map任务分配多个缓存,使得任务运行更有效率

image.png
image.png
image.png
16/18.
MapReduce的具体应用包括哪些?

  • A.关系代数运算(选择、投影、并、交、差、连接)
  • B.分组与聚合运算
  • C.矩阵-向量乘法
  • D.矩阵乘法

PS:课本P141

17/18.
MapReduce执行的全过程包括以下哪几个主要阶段?

  • A.从分布式文件系统读入数据
  • B.执行Map任务输出中间结果
  • C.通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
  • D.执行Reduce任务得到最终结果并写入分布式文件系统

18/18.
下列说法正确的是?

  • A.MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task
  • B.Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动
  • C.在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的
  • D.在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息

image.png