昆明理工大学 天气决策树 下载本文

昆明理工大学信息工程与自动化学院学生实验报告

( — 学年 第1学期 )

课程名称:人工智能 开课实验室:信自楼504 年12月 24日 年级、专业、班 实验项目名称 教师评学号 天气决策树 A.了解□ A.强 □ A.达到□ A.规范□ A.详细□ 姓名 指导教师 成绩 吴霖 该同学是否了解实验原理: 该同学的实验能力: 该同学的实验是否达到要求: 实验报告是否规范: 实验过程是否详细记录: B.基本了解□ B.中等 □ B.基本达到□ B.基本规范□ B.一般 □ C.不了解□ C.差 □ C.未达到□ C.不规范□ C.没有 □ 语 教师签名: 年 月 日 一、上机目的及内容

1.上机内容

根据下列给定的14个数据,运用Information Gain构造一个天气决策树。 属 性 例子编号 天况 温度 湿度 风况 分类 1 2 3 4 5 6 7 8 9

晴 晴 多云 雨 雨 雨 多云 晴 晴 热 热 热 中 冷 冷 冷 中 冷 -1-

大 大 大 大 正常 正常 正常 大 正常 无 有 无 无 无 有 有 无 无 N N P P P N P N P 10 11 12 13 14 雨 晴 多云 多云 雨 中 中 中 热 中 正常 正常 大 正常 大 无 有 有 无 有 P P P P N

2.上机目的

(1)学习用Information Gain构造决策树的方法; (2)在给定的例子上,构造出正确的决策树; (3)理解并掌握构造决策树的技术要点。

二、实验原理及基本技术路线图(方框原理图或程序流程图)

(1)设计并实现程序,构造出正确的决策树;

(2)对所设计的算法采用大O符号进行时间复杂性和空间复杂性分析;

实验考虑到几个属性:天况——晴、雨、多云; 温度——热、中、冷; 湿度——大、正常; 风况——有、无;然后根据每个属性来算出信息增益,接下来我们根据信息增益最大的来进行划分。根据问题设计算法,建立数据结构,设计需要用的类,然后通过编程实现问题求解。了解和求解最大信息增益和最小熵选择平均熵最小的属性作为根节点,用同样的方法选择其他节点直至形成整个决策树。dataset就是具体的划分过程,首先找到可用的划分项目,再第一次划分之后再相关的数据来计算熵。

-2-

Main函数流程图 Dataset函数主要流程图 Basefun函数流程图

Attributevalue函数流程图

-3-