HCIA-大数据试题与答案(共67页).docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《HCIA-大数据试题与答案(共67页).docx》由会员分享,可在线阅读,更多相关《HCIA-大数据试题与答案(共67页).docx(67页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上HCIA-大数据试题与答案1. 下列选项中无法通过大数据技术实现的是?() * 单选题 *A. 商业模式发现B.信用评估C.商品推荐D.运营分析(正确答案)2. FusionInsight Manager 的主要功能有以下哪些?() * 单选题 *A.数据集成B.系统管理C.安全管理(正确答案)D.服务治理(正确答案)(正确答案)3. 假 设 每 个 用 户 最 低 资 源 保 障 设 置 为 yarn , scheduler , capacity , root , QueueA.minimum-user-limit-percent=24。则以下说法错误的是?() *
2、 单选题 *A.第 3 个用户提交任务时,每个用户最多获得 33.33%的资源B.第 2 个用户提交任务时,每个用户最多获得 50%的资源C.第 4 个用户提交任务时,每个用户最多获得 25%的资源D.第 5 个用户提交任务时,每个用户最多获得 20%的资源(正确答案)4. 华为大数据解决方案中平台架构包括以下哪些组成部分?() * 单选题 *A.Hadoop 层B.FusioInght Manager(正确答案)C.GaussDB 200D.DataFram(正确答案)(正确答案)5. Spark 自带的资源管理框架是?() * 单选题 *A.Stand aloneB.MesosC.YARN
3、D.Docker(正确答案)6. 关于 RDD,下列说法错误的是?() * 单选题 *A.RDD 具有血统机制(Lineage)B.RDD 默认存储在磁盘C.RDD 是一个只读的,可分区的分布式数据集D.RDD 是Spark 对基础数据的抽象(正确答案)7. 关于 Spark SQL&Hive 区别与联系,下列说法正确的是?() * 单选题 *A.Spark SQL 依赖 Hive 的元数据B.Spark SQL 的执行引擎为 Spark core,Hive 默认执行引擎为 MapReduceC.Spark SQL 不可以使用 Hive 的自定义函数(正确答案)D.Spark SQL 兼容绝大
4、部分 Hive 的语法和函数(正确答案)(正确答案)8. 在FusionInsight 集群中,Spark 主要与以下哪些组件进行交互?() * 单选题 *A.HDFSB.YARN(正确答案)C.HiveD.ZooKeeper(正确答案)(正确答案)9. 关于 Hive 在FusionInsight HD 中的架构描述错误的是?() * 单选题 *A.只要有一个 HiveServer 不可用,整个 Hive 集群便不可用B.MotaStore 用于提供元数据服务,依赖于 DBServiceC.在同一时间点,HiveServer 只要一个处于 Active 状态,另一个则处于 Standby 状
5、态D.HiveServer 负责接收客户端请求.解析.执行 HQL 命令并返回查询结果(正确答案)10.通常情况下,Hive以文本文件存储的表会以回车作为其行分隔符,在华为FusionInsight Hive 中,可以指定表数据的输入和输出格式处理。() * 单选题 *A.TRUEB.FALSE(正确答案)11. 以下关于 HBase 中HMaster 的功能描述哪些是正确的?() * 单选题 *A.Region 负载均衡,Region 分裂以及分裂后的 Region 分配B.负责建表/修改表/删除表(正确答案)C.负责 RegionServer 的负载均衡(正确答案)D.RegionServ
6、er 失效后的 Region 迁移(正确答案)(正确答案)12. Nimbus 在Streaming 架构中的功能包括?() * 单选题 *A.监控任务执行状态B.任务调度(正确答案)C.启动/关闭工作进程D.资源分配(正确答案)(正确答案)13. Topology 在任务完成后会自动结束运行。() * 单选题 *A.TRUEB.FALSE(正确答案)14. 下面关于 flink 窗口的描述错误的是 () * 单选题 *A.滚动窗口在时间上是重叠的B.滚动窗口在时间上是不重叠的C.滑动动窗口之间时间点不存在重叠(正确答案)D.滑动窗口之间时间点存在重叠(正确答案)15. 在FusionInsi
7、ght Manager 界面中,对 Loader 的操作不包括下列哪个选项?() * 单选题 *A.切换 Loader 主备节点B.启动 Loader 实例C.配置 Loader 参数D.查看 Loader 服务状态(正确答案)16. 创建 Loader 作业中,可以在以下哪个步骤中设置过滤器类型?() * 单选题 *A.输入设置B.转换C.基本信息D.输出(正确答案)17. 以下哪些数据源可以通过 Loader 实现与 FusionInght HD 的数据交换?() * 单选题 *A.NoSQLB.FTP Server(正确答案)C.SFTP Server(正确答案)D.MySQL(正确答案
8、)(正确答案)18. Kafka 日志的清理方式有两种:delete 和compact。默认值是 delete。() * 单选题 *A.TRUEB.FALSE(正确答案)19. kafka-cluster mirroring 工具可以实现以下那些功能?() * 单选题 *A.kafka 集群数据同步方案B.kafka 单集群内数据备份C.kafka 单集群内数据恢复D.以全部不对(正确答案)20. fusioninsight HD 产品中, 一个典型的 kafka 集群包含若干个 producer 若干个consummer 和一个 zookeeper 集群? () * 单选题 *A.trueB
9、.false(正确答案)21. ZKFC 进程部署在 hdfs 中的以下那个节点上?() * 单选题 *A.active namenodeB.standby namenode(正确答案)C.datanodeD.以上全部不对(正确答案)22. 以下关于 Kafka Partition 偏移量的描述不正确的是?() * 单选题 *A.每条消息在文件中的位置称为 offset(偏移量)B.消费者通过(offset.partition.topic)跟踪记录C. 唯一标记一条消息D.Offset 是一个 String 型字符串(正确答案)23. Channel 的作用类似队列,用于临时缓存进来的数据,当
10、 Sink 成功地将数据发送到下一跳的 Channel 或最终目的,数据会从 Channel 移除() * 单选题 *A.TRUEB.FALSE(正确答案)24. Zookeeper 中的数据节点 znode 分为哪几种类型?() * 单选题 *A.semi-persistentB.ephemeralC.temporaryD.persistent(正确答案)(正确答案)25. HDFS 联邦环境下,NameSpace(命名空间)包含以下哪些内容?() * 单选题 *A.目录B.文件(正确答案)C.块(正确答案)D.以上全不正确(正确答案)26. HDFS 存储数据时,关键数据根据实际业务需要保
11、存在具有高度可靠性的节点中,通过修改DataNode 的存储策略,系统可以将数据强制保存在指定的节点组中。() * 单选题 *A.TRUEB.FALSE(正确答案)27. RDD 有Transformation 和Action 算子,下列属于 Action 算子的是?() * 单选题 *A.mapB.saveAsTextFileC.FilterD.reduceByKey(正确答案)28. Spark on Yarn-client 适合用于生产环境是因为可以更快的看到 APP 的输出。() * 单选题 *A.TRUEB.FALSE(正确答案)29. 以下关于 Hive SQL 基本操作描述正确的
12、是?() * 单选题 *A.创建外部表必须要指定 location 信息B.创建外部表使用 external 关键字,创建普通表需要指定 internal 关键字C.加载数据到 Hive 时源数据必须是 HDFS 的一个路径D.创建表时可以指定列分割符(正确答案)30. 在Streaming 中,消息可靠性级别中精确一次是通过 ACK 机制来实现的。() * 单选题 *A.TRUEB.FALSE(正确答案)31. Flume 适用于以下哪些场景的数据收集?() * 单选题 *A.Thrift,Avro,Syslog,Kafka 等数据源上收集数据B.本地文件数据采集(正确答案)C.应用系统产生
13、的日志采集(正确答案)D.大量数据的实时数据采集(正确答案)32. 在 Zookeeper 和Yarn 的协同工作中,当 Active ResourceManager 产生故障时,Standby ResourceManager 会从以下哪些目录中获取 Application 相关信息?() * 单选题 *A.metastoreB.StatestoreC.StoreageD.Warehouse(正确答案)33. ZooKeeper 所有节点都可以处理读请求。() * 单选题 *A.TRUEB.FALSE(正确答案)34. HDFS 的副本放置策略中,同一机架不同的服务器之间的距离是() * 单选
14、题 *A.3B.2C.1D.4(正确答案)35. 下列哪些措施是为了保障数据的完整性() * 单选题 *A. 元数据可靠性保证B.重建失效数据盘的副本数据(正确答案)C.安全模式(正确答案)D.集群数据均衡(正确答案)(正确答案)36. Zookeeper 的Scheme 认证方式不包括以下哪项?() * 单选题 *A.digestB.saslC.authD.world(正确答案)37. MapReduce 过程中,以下属于 Shuffle 机制的是?() * 单选题 *A.CopyB.PartitionC.CombineD.Sort/Merge(正确答案)(正确答案)38. FusionIn
15、sight Manager 可以对哪些项目进行健康检查?() * 单选题 *A.角色B.主机(正确答案)C.服务(正确答案)D.实例(正确答案)(正确答案)39. FusionInsight Manager 与外部管理平台对接时,支持哪些接口?() * 单选题 *A.VPNB.SyslogC.FTP(正确答案)D.SNMP(正确答案)(正确答案)40. 下列选项中适合 MapReduce 的场景有?() * 单选题 *A.实时交互计算B.迭代计算C.流式计算D.离线计算(正确答案)41. 以下关于 FusionInsight 中CarbonData 说法正确的有?() * 单选题 *A.使用
16、Carbon 的目的是对大数据即席查询提供超快速响应。B.Carbon 使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少 60%-80%数据存储空间,大大节省硬件存储成本。(正确答案)C.Carbon 是一种新型的 Apache Hadoop 本地文件格式,使用先进的列式存储.索引.压缩和编码技术,以提高计算效率,有助于加速超过 PB 数量级的数据查询,可用于更换的交互查询。(正确答案)D.Carbon 也是一种将数据源与 Spark 集成的高性能分析引擎。(正确答案)(正确答案)42. HDFS 联邦机制下,各 NameNode 间元数据是不共享的。() * 单选题 *A.TRUE
17、B.FALSE(正确答案)43. ApplicationMaster 采用轮询的方式通过RPC 协议向ResourceManager 申请和领取资源。() * 单选题 *A.TRUEB.FALSE(正确答案)44. 在 YARN 的任务调度中, 一旦 ApplicationMaster 申请到资源后, 使与对应的Resource Manager 通信,要求它启动任务() * 单选题 *A.TRUEB.FALSE(正确答案)45. 如图所示,下列哪些选项属于宽依赖()* 单选题 *A.groupby:A-BB.map:C-DC.union:D&E-FD.join:B&F-G(正确答案)(正确答案
18、)46. HFS 的出现解决了需要在 HDFS 中存储大量的小文件(10MB 以下)。同时也要存储一些大文件(10MB 以上)的混合的场景() * 单选题 *A.TRUEB.FALSE(正确答案)47. 下列哪个命令是从 HDFS 下载目录/文件到本地的?() * 单选题 *A.dfs-putB.dfs-catC.dfs-getD.dfs-mkdir(正确答案)48. 以下选项中,属于 HDFS 架构关键特性的是?() * 单选题 *A.HA 高可靠性B.健壮机制(正确答案)C.元数据持久化机制(正确答案)D.多方式访问机制(正确答案)(正确答案)49. HBase 的主 HMaster 是如
19、何选举的?() * 单选题 *A.由 RegionServer 进行裁决B.HMaster 为双主模式,不需要进行裁决C.通过 ZooKeeper 进行裁决D.随机选举(正确答案)50. 关于 Hive 与Hadoop 其他组件的关系。以下描述错误的是?() * 单选题 *A.Hive 最终将数据存储在 HDFS 中B.Hive 是 Hadoop 平台的数据仓库工具C.HQL 可以通过 MapReduce 执行任务D.Hive 对HBase 有强依赖(正确答案)51. Hive 不支持超时重试机制。() * 单选题 *A.TRUEB.FALSE(正确答案)52. FusionInsight 中
20、,HiveServer 将用户提交的 HQL 语句进行编译,解析成对应的 Yarn 任务.Spark 任务或者 HDFS 操作,从而完成数据转换,分析。() * 单选题 *A.trueB.False(正确答案)53. HBase 的Region 是由哪个服务进程来管理的?() * 单选题 *A.HRegionServerB.ZooKeeperC.HMasterD.DataNode(正确答案)54. Streaming 的处理节点 Bolt 中,可以完成以下哪些操作?() * 单选题 *A.连接运算B.过滤(Filter)(正确答案)C.连接数据库(正确答案)D.业务处理(正确答案)(正确答案)
21、55. Flume 传输的可靠性是指 Flume 在传输数据过程中,当下一跳的 Flume 节点故障或者数据接收异常时,可以自动切换到另外一路上继续传输?() * 单选题 *A.TrueB.False(正确答案)56.FusionInsightHD集群中包含了多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?() * 单选题 *A.HDFSB.NameNodeC.DataNode(正确答案)D.HBase(正确答案)57. FusionInsight HD 系统中使用Streaming 客户端Shell 命令提交了拓扑之后,使用 Storm UI 查看发现该拓扑长时间没有处理数据,可能
22、原因有?() * 单选题 *A.查看客户端异常堆栈,判断是否客户端使用问题B.查看主 Nimbus 的运行日志,判断是否 Nimbus 服务端异常(正确答案)C.查看 Supervisor 运行日志,判断是否 Supervisor 异常(正确答案)D.查看 Worker 运行日志(正确答案)(正确答案)58. 假设 HDFS 在写入数据是只存 2 份,那么在写入过程中,HDFS Client 先将数据写入DataNode1,再将数据写入 DataNode2。() * 单选题 *A.TrueB.False(正确答案)59. 容力量调度器在尽心资源分配,现有同级的 2 个队列Q1和Q2,他们的容量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- HCIA 数据 试题 答案 67
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内