数据挖掘_xxx_xxxx 下载本文

中南民族大学 计算机科学学院

《数据挖掘与知识发现》

综合实验报告

姓 名

年 级 级 专 业 软件工程

指导教师 李波 学 号

序 号 31 实验类型 综合型

成绩评定 评语: 教师签名: 年 月 日

2016 年 12月 15 日

第 1 页 共 35 页

年级 组号 实验 名称 专 业 实验室 软件工程 9-205 班级 日期 数据挖掘与知识发现 分项内容 实验级别 实 验 内 容 Weka环境熟悉;决策树(1) 决策树(2) 关联规则,聚类分析 KDD案例 属性相关性,神经网络(1) 神经网络(2) 小 组 成 员 姓名

学号 组内分工 自我评分 教师评分 第 2 页 共 35 页

实验 Weka环境熟悉;决策树(1) 分项1 实 验 目 的 1. 熟悉Weka软件的环境和基本用法。 2. 掌握ARFF数据文件的编制方法。 3. 学习应用Weka软件建立决策树的方法,并理解决策树的剪枝和未剪枝的分类效果。 1、 参照教材 19 -22 页内容,熟悉 页内容,熟悉 WekaWeka Weka软件的安装及使用环境; 实 验 要 求 2、在记事本程序中编制 ColdType training.arff, ColdTypetest.arff . 3、打开 WekaWeka Weka软件,并参 软件,并参 照教材 1.9.2 1.9.2 ,完成相关操作并 小节,完成相关操作并 小节,完成相关操作并 小节,完成相关操作并 理解 相应 处理结果。 4、根据教材表 2.1 所提供的数据集 T,基于 WekaWeka Weka软件,应用 C4.5 算法建立决策树, 预测某个学生是否决定去打篮球。 要求:( 1)采用 arff arff文件来完成; 文件来完成;(2)分别完成决策树剪枝和未的情况。 1.熟悉Weka软件的环境和基本用法并编写arff文件。 (1) 我们实验中Weka访问的数据格式是arff格式的。 (2) 运行Weka后,出现了窗口,我们在里面选择Explorer界面。 (3) 在Preprocess选项卡,点击file按钮,加载arff文件,就可以对文件中的数据进行采集挖掘。 (4) 用@data定义数据集的开始,数据值用逗号隔开,若存在缺失数据,则用问号表示。 实 验 原 理 步 骤 ( 算 法 流 程 ) 2.打开Weka软件,按照教材要求完成相关操作,并理解相应处理结果 (1)在打开arff文件后,界面详细显示了数据集的实例个数,属性值的比例关系等。 图1 第 3 页 共 35 页