以下对Hadoop的说法错误的是()。
A.Hadoop的核心是HDFS和Map Reduce
B.Hadoop是基于Java语言开发的,只支持Java语言编程
C.Hadoop2.0增加了Name NodeHA和Wire-compatibility两个重大特性
D.Hadoop Map Reduce是针对谷歌Map Reduce的开源实现,通常用于大规模数据集的并行计算
A.Hadoop的核心是HDFS和Map Reduce
B.Hadoop是基于Java语言开发的,只支持Java语言编程
C.Hadoop2.0增加了Name NodeHA和Wire-compatibility两个重大特性
D.Hadoop Map Reduce是针对谷歌Map Reduce的开源实现,通常用于大规模数据集的并行计算
A.Hadoop是一个能够对大量数据进行分布式处理的软件框架
B.作为并行分布式计算平台,Hadoop采用分布式存储和分布式处理两大核心技术,能够高效地处理PB级数据
C.Hadoop只支持Java编程语言
D.Hadoop可以高效稳定地运行在廉价的计算机集群上,可以扩展到数以千计的计算机节点上
A.在NameNode节点上的dfs.hosts中追加上新增节点的hostname
B.在每个新增数据节点的hosts文件中加入NameNode的hostname
C.在其他节点上执行刷新操作:hdfsdfsadmin-refreshNodes
D.在SecondaryNameNode节点上的slaves文件中追加新增数据节点的hostname
A.是一种通过网络实现文件在多台主机上进行分布式存储的文件系统
B.所有的分布式文件系统的设计都是采用“客户机/服务器”(Client/Server)模式
C.谷歌开发了分布式文件系统GFS
D.Hadoop分布式文件系统(HadoopDistributedFileSystem,HDFS)是针对GFS的开源实现
A.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
B.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
C.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
D.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
A.它运行在通用硬件上
B.它是Apache软件基金会(ASF)下的项目
C.它是最好的实时流式数据处理框架
D.Hadoop对数据的处理是有延迟的
A.计算资源标签调度是yarm的特征,存储资源调度是HDFS的特征
B.通过存储资源标签,可以将在线应用数据存储在SAS盘节点的HDFS目录下,而离线应用数据存储在SATA盘节点对应的HDFS目录下
C.通过计算资源标签,可以将spark作业调度到大内存节点上运行,而MR作业调度在标配内存节点上运行
D.计算资源和存储资源的标签通常配合使用,是为了将指定的应用跨节点访问计算和数据资源
A.技术工具不同,大数据使用Hadoop生态体系技术
B.管理的数据量不同,大数据通常管理TB、PB级数据
C.管理的服务器的数量不同,大数据通常为100+台以上的服务器
D.对系统的性能要求不同,大数据要求实时流计算技术的高性能系统
A.DataWorks是基于MaxCompute作为计算引擎的
B.DataWorks是基于MaxCompute作为存储引擎的
C.DataWorks可以使用Hadoop作为底层引擎
D.DataWorks的底层计算引擎是