在Map工作完成之后,每一个Map函数会将结果传到对应的Reducer所在的节点,此时,用户可以提供一个()类,用来决定一个给定的(key,value)对传给哪个节点。
A.Map
B.Reduce
C.InputFormat
D.Partitioner
A.Map
B.Reduce
C.InputFormat
D.Partitioner
A.map
B.flatMap
C.filter
D.union
A.<"hello",1,1>、<"hadoop",1>和<"world",1>
B.<"hello",2>、<"hadoop",1>和<"world",1>
C.<"hello",<1,1>>、<"hadoop",1>和<"world",1>
D.<"hello",1>、<"hello",1>、<"hadoop",1>和<"world",1>
A.count():返回数据集中的元素个数
B.filter(func):筛选出满足函数func的元素,并返回一个新的数据集
C.take(n):返回数据集中的第n个元素
D.map(func):将每个元素传递到函数func中,并将结果返回为一个新的数据集
A.jstack可以定位maptask进程线程堆栈情况,如locked,timeout情况
B.maptask跨网络读数据块情况,查看此maptask进程是从那个datanode来读数据块
C.检查运行maptask节点资源情况与读取数据块的datanode的资源情况,如cpu负载,数据盘I/O与繁忙情况;或disabledTHP设置情况
D.检查运行maptask节点与读取数据块的datanode的网络情况,如检查网络丢包,datanode日志SlowBlockReceiver记录,网卡状态模式