本课程的主要教学内容:大数据技术的基本概念、数据科学入门、数据可视化初步、典型大数据分析方法、Hadoop技术框架和大数据主要应用等。国开2022年春《大数据技术》(专科)形考任务4试题及答案由学赛网为您提供整理,仅供参考。
A.实时获取来自不同数据源的海量数据,经过实时分析处理,获得有价值的信息
B.流计算秉承一个基本理念,即数据的价值随着时间的流逝而降低
C.对于一个流计算系统来说,它应该支持TB级甚至是PB级的数据规模
D.流计算只需要保证较低的延迟时间,即只达到秒级别即可处理一切问题
A.在传统的数据处理流程中,存储的数据是旧的
B.在传统的数据处理流程中,需要用户主动发出查询来获取结果
C.传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中
D.流计算的处理流程一般包含三个阶段:数据实时采集、数据批量计算、实时查询服务
A.Storm虽然可以做到低延迟,但是无法实现高吞吐,也不能在故障发生时准确地处理计算状态
B.Spark Streaming通过采用微批处理方法实现了高吞吐和容错性,但是牺牲了低延迟和实时处理能力
C.Flink实现了GoogleDataflow流计算模型,是一种兼具高吞吐、低延迟和高性能的实时流计算框架,并且同时支持批处理和流处理
D.Spark Streaming可以实现毫秒级响应,而Flink只能实现秒级响应
A.许多非图结构的大数据,通常会被转换为关系模型后进行分析
B.许多大数据都是以大规模图或网络的形式呈现
C.图数据结构很好地表达了数据之间的关联性
D.关联性计算是大数据计算的核心
A.顶点值(Vertexvalue):顶点对应的PR值
B.出射边(Outedge):只需要表示一条边,可以不取值
C.消息(Message):传递的消息
D.入射边(Iutedge):只需要表示一条边,可以不取值
A.数据可视化是指将大型数据集中的数据以图形图像形式表示
B.利用数据分析和开发工具发现其中未知信息的处理过程
C.数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元素表示
D.将数据的各个属性值以一维数据的形式表示
A.UserCF算法的推荐更偏向社会化:适合应用于新闻推荐、微博话题推荐等应用场景,其推荐结果在新颖性方面有一定的优势
B.ItemCF算法的推荐更偏向于个性化
C.ItemCF随着用户数目的增大,用户相似度计算复杂度越来越高
D.UserCF推荐结果相关性较弱,难以对推荐结果作出解释,容易受大众影响而推荐热门物品
A.推荐系统是大数据在互联网领域的典型应用
B.推荐系统是自动联系用户和物品的一种工具
C.推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
D.推荐系统分为基于物品的协同过滤和基于商家的协同过滤
A.数据快速持续到达,潜在大小也许是无穷无尽的
B.数据来源众多,格式复杂
C.注重数据的整体价值,不过分关注个别数据
D.系统可以控制将要处理的新到达的数据元素的顺序
A.批量计算:充裕时间处理静态数据,如Hadoop
B.静态数据不适合采用批量计算,因为它不适合用传统的关系模型建模
C.流数据必须采用实时计算
D.流数据的响应时间一般为秒级,甚至需要毫秒级
A.为特定的图应用定制相应的分布式实现:通用性不好
B.基于现有的分布式计算平台进行图计算:在性能和易用性方面往往无法达到最优
C.使用单机的图算法库,但是,在可以解决的问题的规模方面具有很大的局限性
D.使用已有的并行图计算系统,但是,对大规模分布式系统非常重要的一些方面(比如容错),无法提供较好的支持
A.谷歌公司的制图服务接口Google Chart API,可以用来为统计数据并自动生成图片
B.D3是最流行的可视化库之一,是一个用于网页作图、生成互动图形的JavaScript函数库
C.ECharts是由百度公司前端数据可视化团队研发的图表库,可以流畅地运行在PC和移动设备上
D.大数据魔镜是一款优秀的国产数据分析软件,它丰富的数据公式和算法可以让用户真正理解探索分析数据
A.推荐系统:为用户推荐相关商品
B.物流:基于大数据和物联网技术的智能物流
C.智能交通:利用交通大数据,实现交通实时监控
D.汽车:无人驾驶汽车,实时采集车辆各种行驶数据和周围环境
A.为了让用户从海量信息中高效地获得自己所需的信息,推荐系统应运而生
B.推荐系统是大数据在互联网领域的典型应用
C.推荐系统是自动联系用户和物品的一种工具
D.推荐系统是利用大数据调整线下门店布局、控制店内人流量