数据挖掘与知识获取练习题

《数据挖掘与知识获取》总复习题

1.数据挖掘系统可以根据什么标准进行分类? 2.知识发现过程包括哪些步骤? 3.什么是概念分层?

4.多维数据模型上的OLAP操作包括哪些? 5.OLAP服务器类型有哪几种? 6.数据预处理技术包括哪些? 7.什么是数据清理? 8.什么是数据集成? 9.什么是数据归约?

10.数据清理的内容包括哪些? 11.什么是数据挖掘?

12.数据仓库的主要特征是什么? 13.什么是数据集市?

14.数据库中的知识发现过程由哪几个步骤组成? 15.典型的数据挖掘系统有哪几个主要成分?

16.在数据挖掘系统中,为什么数据清理十分重要? 17.脏数据形成的原因有哪些?

18.数据清理时,对空缺值有哪些处理方法? 19.什么是数据变换?包括哪些内容? 20.数据归约的策略包括哪些? 21.假定属性income的最小值与最大值分别为¥12000和¥98000,如映射income到区间[0.0,1.0],根据min-max规范化,income值¥73600将变为 。 22.假定属性income的平均值和标准差分别为¥54000和¥16000。使用Z-score规范化,值¥73600被转换为 。

23.假定A的值由-986到917。A的最大绝对值为986,使用小数定标规范化,-986被规范化为 。

24.从结构角度来看,有三种数据仓库模型________________。 25.与数据挖掘类似的术语有哪些?

26.可以对按季度汇总的销售数据进行______,来观察按月汇总的数据。 A 上卷 B 下钻 C 切片 D切块

27.可以对按城市汇总的销售数据进行______,来观察按国家总的数据。 A 上卷 B 下钻 C 切片 D切块

28.通过不太详细的数据得到更详细的数据,称为________。 A 上卷 B 下钻 C 细化 D维规约

29.已知事务数据库D,假定最小支持度为2,求所有的频繁项集和它们的支持度。

30.常用的四种兴趣度的客观度量。

简单性 确定性 实用性 新颖性 31.四种常用的概念分层类型。

模式分层、集合分组分层、操作导出的分层、基于规则的分层。 32.多维数据仓库有哪几种概念模型? 33. 形成“脏数据”的原因有哪些?

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4