![](https://static.youtibao.com/asksite/comm/pc/images/content_title_q.png)
关于Spark的描述,以下哪项是错误的?()
A.Spark是一个基于内存迭代的框架
B.Spark是一个数据分析技术栈,包含了大数据的多种计算模式
C.Spark可以采用多种编程语言进行开发,比如Scal
D.Java
E.Spark计算过程中,数据不会落地到磁盘
![](https://static.youtibao.com/asksite/comm/pc/images/content_title_a.png)
A.Spark是一个基于内存迭代的框架
B.Spark是一个数据分析技术栈,包含了大数据的多种计算模式
C.Spark可以采用多种编程语言进行开发,比如Scal
D.Java
E.Spark计算过程中,数据不会落地到磁盘
第1题
A.Hadoop是一个能够对大量数据进行分布式处理的软件框架
B.作为并行分布式计算平台,Hadoop采用分布式存储和分布式处理两大核心技术,能够高效地处理PB级数据
C.Hadoop只支持Java编程语言
D.Hadoop可以高效稳定地运行在廉价的计算机集群上,可以扩展到数以千计的计算机节点上
第2题
A、一个reduce的输入数据可能来自于多个map的输出
B、一个MR处理可以不包括任何map
C、一个MR处理可以不包括任何reduce
D、一个map的输出结果可能会被分配到多个reduce上去
第3题
A.对各种数据计算模型的统一抽象
B.RDD是一个读、写、分区记录的集合
C.Spark的计算过程主要是RDD的迭代计算过程
D.一个存储数据的数据结构
第4题
A.Python语言的缩进可以采用Tab键实现
B.Python单层缩进代码属于之前最邻近的一行非缩进代码,多层缩进代码根据缩进关系决定所属范围
C.判断、循环、函数等语法形式能够通过缩进包含一批Python代码,进而表达对应的语义
D.Python语言不采用严格的“缩进”来表明程序的格式框架
第5题
A.MR框架过多的磁盘操作,缺乏对分布式内存的支持
B.MR框架无法高效地支持迭代式计算
C.MR框架无法高效地支持交互式数据挖掘任务
D.MR框架无法进行分析性计算任务
第6题
A.CSV文件的每一行是一维数据,可以使用Python中的列表类型表示
B.CSV文件通过多种编码表示字符
C.整个CSV文件是一个二维数据
D.CSV文件格式是一种通用的文件格式,应用于程序之间转移表格数据
第7题
A.算法可以用伪代码、流程图等多种形式来描述
B.一个正确的算法必须有输入
C.一个正确的算法必须有输出
D.用流程图可以描述的算法可以用任何一种计算机高级语言编写成程序代码
第8题
A.MapReduce采用“ 分而治之”策略
B.MapReduce设计的一个理念就是“ 计算向数据靠拢”
C.MapReduce框架采用了Master/Slave架构
D.MapReduce应用程序只能用Java来写
第9题
A.NoSQL数据库因为不受schema的限制,可以获得比传统关系型数据库更好的读写性能,因此,所有应用都可以使用NoSQL数据库替代关系型数据库。
B.NoSQL数据库类型可以分为键值型NoSQL数据库,文档型NoSQL数据库,列存储型NoSQL数据库和图NoSQL数据库
C.Redis是单纯的内存数据库,不提供数据持久化功能,因此可靠性很低。
D.Spark分布式计算框架可以支持多种计算模式,包括批处理、流处理和SQL查询。
第10题
A、大数据计算服务提供了高并发低延迟(毫秒级)的处理能力,对海量数据进行灵活分析
B、大数据计算服务提供了高并发吞吐量上传下载工具,可以将外部数据源中的数据高效的同步到大数据计算服务中去
C、大数据计算服务支持使用SQL或者MapReduce编程对海量数据进行处理
D、大数据计算服务可以对海量数据进行基于复杂算法的分析,如聚类、分类、回归、主成分分析等