探索大数据和人工智能
1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。 A首席数据官 B.首席科学家 C.首席执行官 D.首席架构师
2、整个 MapReduce的过程大致分为Map、 Shuffle、 Combine、()? A. Reduce B.Hash C. Clean D. Loading
3、在Spak的软件栈中,用于交互式查询的是 A. SparkSQL B.Mllib C.GraphX
D. Spark Streaming
4、在数据量一定的情况下, MapReduce是一个线性可扩展模型,请问服务器数量与处( )理时间是什么关系? A数量越多处理时间越长
B.数量越多处理时间越短 C.数量越小处理时间越短 D.没什么关系
5、下列选项中,不是 kafka适合的应用场景是? A.日志收集 B.消息系统 C.业务系统 D.流式处理
6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是 A.结构化数据 B.非结构化数据 C.半结构化数据 D.全结构化数据
7、下列选项中,不是人工智能的算法中的学习方法的是? A.重复学习 B.深度学习 C.迁移学习 D.对抗学习
8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是 A.机器性能 B.语言歧义性 C.知识依赖 D.语境
9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的类型,称为什么? A.给定标签 B.离散 C.分类 D.回归
10、中国移动自主研发、发布的首个人工智能平台叫做() A.九天 B. OneNET C.移娃 D.大云
11、HDFS中 Namenodef的 Metadata的作用是? A.描述数据的存储位置等属性 B.存储数据