本课程以CentOS 7、Eclipse等作为实验开发环境和工具,搭建包括Hadoop、HBase、ZooKeeper、Spark等Hadoop生态圈的实验集群,通过经典的相关实验,巩固学生的大数据基础理论知识,使学生由浅入深、由点到面地逐步提高,能结合具体实验熟悉大数据基础技术,提高学生的综合实践能力。国开2022年春《大数据技术》(专科)形考任务2试题及答案由学赛网为您提供整理,仅供参考。
A.爬虫持续不断地抓取新页面,这些页面每隔一段时间地存储到BigTable里
B.BigTable是一个分布式存储系统
C.BigTable起初用于解决典型的互联网搜索问题
D.网络搜索应用查询建立好的索引,从BigTable得到网页
A.GFS与HDFS相对应
B.GFS与Zookeeper相对应
C.MapReduce与HadoopMapReduce相对应
D.Chubby与Zookeeper相对应
A.HBase采用了更加简单的数据模型,它把数据存储为未经解释的字符串
B.HBase操作不存在复杂的表与表之间的关系
C.HBase不支持修改操作
D.HBase在设计上就避免了复杂的表和表之间的关系
A.RDBMS有关系代数理论作为基础,NoSQL没有统一的理论基础
B.NoSQL很难实现横向扩展,RDBMS可以很容易通过添加更多设备来支持更大规模的数据
C.RDBMS需要定义数据库模式,严格遵守数据定义,NoSQL一般不存在数据库模式,可以自由灵活定义并存储各种不同类型的数据
D.RDBMS借助于索引机制可以实现快速查询,很多NoSQL数据库没有面向复杂查询的索引
A.云数据库是部署和虚拟化在云计算环境中的数据库
B.云数据库是在云计算的大背景下发展起来的一种新兴的共享基础架构的方法
C.云数据库价格不菲,维护费用极其昂贵
D.云数据库具有高可扩展性、高可用性、采用多租形式和支持资源有效分发等特点
A.Hadoop可以很好地解决大规模数据的离线批量处理问题,但是,受限于HadoopMapReduce编程框架的高延迟数据处理机制,使得Hadoop无法满足大规模数据实时处理应用的需求上
B.HDFS面向批量访问模式,不是随机访问模式
C.传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题
D.传统关系数据库在数据结构变化时一般需要停机维护;空列浪费存储空间
A.无法满足海量数据的管理需求
B.无法满足数据高并发的需求
C.无法满足高可扩展性和高可用性的需求
D.使用难度高
A.复杂性:部署、管理、配置很复杂
B.数据库复制:MySQL主备之间一般采用复制方式,很多时候是异步复制
C.扩容问题:如果系统压力过大需要增加新的机器,这个过程涉及数据重新划分
D.动态数据迁移问题:如果某个数据库组压力过大,需要将其中部分数据迁移出去
A.Web2.0网站系统通常不要求严格的数据库事务
B.Web2.0网站系统基本上不用关系数据库来存储数据
C.Web2.0并不要求严格的读写实时性
D.Web2.0通常不包含大量复杂的SQL查询
A.Amazon是云数据库市场的先行者
B.Google Cloud SQL是谷歌公司推出的基于MySQL的云数据库
C.从数据模型的角度来说,云数据库并非一种全新的数据库技术
D.云数据库并没有专属于自己的数据模型
A.保持单一的系统对外入口,并且为系统内部维护单一的资源池
B.消除单点故障,保证服务的高可用性
C.保证系统具有良好的可伸缩,能够动态地增加、删减计算与存储节点
D.保证分配给用户的资源也是弹性可伸缩的