A.Job和JobControl类可以管理非线性作业之间的依赖
B.ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成
C.使用ChainReducer时,每个mapper和reducer对象都有一个本地JobConf对象
D.ChainReducer.addMapper()方法中,一般对键/值对发送设置成值传递,性能好且安全性高
A.mapper调优主要目标之一是减少输出量
B.可以通过对输出进行压缩设置进行mapper调优
C.比较适合map的输出是数值型的,方便进行统计
D.尽量减少combiner,以降低对I/O的读写压力
A.<mapper resource="com/bw/bean/UserMapper.xml"/>
B.<mapper resource="com.bw.bean.UserMapper.xml"/>
C.<mapper class="com/bw/bean/UserMapper.xml"/>
D.<mapper url="com.bw.bean.UserMapper.xml"/>
A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
B.Hadoop被视为事实上的大数据处理标准
C.Hadoop为海量数据提供存储的HDFS和对数据进行计算的MapReduce
D.Hadoop提供整个HDFS文件系统的命名空间管理,块管理等所有服务
A.远程提交
B.本地提交
C.阻塞方式
D.非阻塞方式
A.ReduceJoin可以实现内链接,也能实现各种外连接
B.ReduceJoin的join操作是在MapReduce程序中的reducer阶段完成的
C.MapJoin也适合各种join场景,也能实现内连接和各种外链接
D.MapJoin不会产生数据倾斜
A.可以通过调整Mapper的个数间接的影响Reducer的个数(Reducer的个数默认为Mapper个数的1/4)
B.在编程的时候(以Java为例),初始化Reducer的方法里,可手工指定Reducer个数
C.可以通过setNumReducerTasks来设置
D.可以通过addReducer随意增加Reducer的个数