第1题
A.jstack可以定位maptask进程线程堆栈情况,如locked,timeout情况
B.maptask跨网络读数据块情况,查看此maptask进程是从那个datanode来读数据块
C.检查运行maptask节点资源情况与读取数据块的datanode的资源情况,如cpu负载,数据盘I/O与繁忙情况;或disabledTHP设置情况
D.检查运行maptask节点与读取数据块的datanode的网络情况,如检查网络丢包,datanode日志SlowBlockReceiver记录,网卡状态模式
第4题
A.负责整个集群的健康监控
B.维护map信息并负责集群节点和客户端信息的更新
C.部署节点既可以奇数个又可以偶数个,但建议奇数个
D.osd和monitors可以部署在一起,但生产环境建议分开部署
第7题
A.客户端程序设置的mapTask的个数
B.输入的总文件数
C.FileInputFormat.getSplits(JobContext job)计算出的逻辑切片的数量
D.输入的总文件大小/数据块大小
第9题
A.Map/Reduce把待处理的数据集分割成许多大的数据块
B.大数据块经Map()函数并行处理后输出新的中间结果
C.reduce()函数把多任务处理后的中间结果进行汇总
D.reduce阶段的作用接受来自输出列表的迭代器
第10题
A.执行Reduce任务得到最终结果并写入分布式系统文件
B.通过Shuffle阶段把中间结果分区排序整理后发送给Reduce任务
C.执行Map任务输出中间结果
D.从分布式文件系统读入数据
第11题