下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能?()
A.利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理
B.利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C.构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
D.把实时采集的数据作为流计算系统的输入,进行实时处理分析
A.利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理
B.利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C.构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
D.把实时采集的数据作为流计算系统的输入,进行实时处理分析
第2题
A.实现高效存储成为存储技术主要研究方向
B.云存储系统从向多应用服务方向发展
C.关系数据库和分布式数据管理方式逐步走向融合
D.关系数据库和分布式数据管理方式将无法走向融合
第4题
B.大规模并行计算:在分布式并行环境中将一个任务分解成更多份细粒度的子任务,这些子任务在空闲的处理节点之间被调度和快速处理之后,最终通过特定的规则进行合并生成最终的结果。典型技术为MapReduce
C.结构化分布式数据存储:类似文件系统采用数据库来存储结构化数据,云计算也需要采用特殊技术实现结构化数据存储,典型技术为BigTable/Dynamo等
D.分布式文件系统:可扩展的支持海量数据的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,提供容错功能(通常保留数据的3份拷贝),典型技术为GFS/HDFS/KFS等
第5题
A.分布式文件系统HDFS
B.分布式非关系型数据库Hbase
C.数据仓库及数据分析工具Hive和Pig
D.用于数据采集、转移和汇总的工具Sqoop和Flume。
第6题
A.物联网数据中心常采用RAID技术提供比单个硬盘更高的存储性能和数据备份方案。
B.数据仓库主要用于数据的长期存储和备份。
C.NAS采用专门的文件服务器连接存储设备,SAN一般将存储设备作为独立设备通过光纤通道连在网中。
D.目前在物联网、云计算、大数据领域广泛使用的数据库都是关系型数据库。
第8题
A.高性能关系型数据库、NoSQL数据库、MPP、分布式计算、分布式文件系统、网络文件系统、日志或数据处理应用等
B.游戏服务器、Web服务器、业务服务器、中小型数据库等
C.适合对IO负载要求不高,但总容量较大,希望存储成本较低的场景。例如Web服务器、日志服务器、备份、大数据运算等
D.广告精准营销、电商、移动APP