Hadoop实现了一个分布式文件系统,其中一个组件是HDFS。关于HDFS,下列说法中正确的有()。
A.为海量的数据提供了存储
B.有高容错性的特点,并且设计用来部署在低廉的硬件上
C.它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序
D.为海量的数据提供了计算
E.放宽了POSIX的要求,可以以流的形式访问件系统中的数据
A.为海量的数据提供了存储
B.有高容错性的特点,并且设计用来部署在低廉的硬件上
C.它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序
D.为海量的数据提供了计算
E.放宽了POSIX的要求,可以以流的形式访问件系统中的数据
第2题
A.一个NameNode使用一个Blockpool管理数据块
B.一个NameNode可使用多个Blockpool管理数据块
C.每个Blockpool的磁盘空间是物理共享的,逻辑空间是隔离的
D.支持NameNode/Namespace水平扩展
第3题
A.HDFS的扩展性很弱
B.它是Hadoop实现的一个分布式文件系统
C.HDFS满足超大规模的数据集需求
D.HDFS支持流式的数据访问
第4题
A.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
B.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
C.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
D.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
第5题
A.HDFS是Hadoop技术体系中数据管理的基础,是一个高容错的系统,能检测和应对硬件故障
B.Sqoop数据同步工具,它是SQL TO Hadoop的缩写,主要用于关系型数据库和Hadoop之间的数据传输
C.Sqoop数据导入和导出本质上还是一个MapRuduce程序,充分利用了MapRuduce的并行化和容错性
D.Kafka主要用于处理活跃的流式数据,在web网站上非常常见,包括网站的pageview
第6题
A.数据处理框架(MapReduce),集群管理(YARN),分布管理控制(ZooKeeper)
B.Spark高效数据处理架构
C.安全管理组件
D.Hadoop的客户端
第8题
A.是一种通过网络实现文件在多台主机上进行分布式存储的文件系统
B.所有的分布式文件系统的设计都是采用“客户机/服务器”(Client/Server)模式
C.谷歌开发了分布式文件系统GFS
D.Hadoop分布式文件系统(HadoopDistributedFileSystem,HDFS)是针对GFS的开源实现
第9题
A.HadoopYARN的目的是使得Hadoop数据处理能力超越HDFS
B.HadoopMapReduce也是YARN上的一个应用
C.YARN的另一个目标就是拓展Hadoop
D.有了YARN各种应用就可以互不干扰地运行在同一个Hadoop系统中