实验内容 使用FISHER线性判别来对树叶进行分类 指导老师_王旭初_____
一.实验目的
利用FISHER线性判别函数来对桃树叶子和芒果树叶子进行分类,将这两者若干片树叶进行一定特点分类,做出函数图,使得我们容易分析这两者之间的异同。
二.数据获取方式
实验过程中将会使用到FISHER线性判别函数法,MATLAB实验仿真程序。通过实验MATLAB程序来设计一个FISHER线性判别分类器,将实验前收集到的两种树叶的若干片叶子的数据输入分类器,运行后得出一个分类仿真图形,从而可以得出其叶子间的异同点。
三.实验原理
Fisher线性判别分析的基本思想:通过寻找一个投影方向(线性变换,线性组合),将高维问题降低到一维问题来解决,并且要求变换后的一维数据具有如下性质:同类样本尽可能聚集在一起,不同类的样本尽可能地远。
Fisher线性判别分析,就是通过给定的训练数据,确定投影方向W和阈值y0,即确定
线性判别函数,然后根据这个线性判别函数,对测试数据进行测试,得到测试数据的类别。
线性判别函数的一般形式可表示成 g(X)?WTX?w0 其中
?w1???x?1????w?X???? W??2?
??x????d??w??d?
根据Fisher选择投影方向W的原则,即使原样本向量在该方向上的投影能兼顾类间分布尽可能分开,类内样本投影尽可能密集的要求,用以评价投影方向W的函数为:
~?m~)2(m12 JF(W)?~2~2S1?S2?1W*?SW(m1?m2)
上面的公式是使用Fisher准则求最佳法线向量的解,该式比较重要。另外,
?1
该式这种形式的运算,我们称为线性变换,其中m1?m2式一个向量,SW是SW的逆矩?1阵,如m1?m2是d维,SW和SW都是d×d维,得到的W*也是一个d维的向量。
向量W*就是使Fisher准则函数JF(W)达极大值的解,也就是按Fisher准则将d维X空间投影到一维Y空间的最佳投影方向,该向量W*的各分量值是对原d维特征向量求加权和的权值。
以上讨论了线性判别函数加权向量W的确定方法,并讨论了使Fisher准则函数极大的d维向量W* 的计算方法,但是判别函数中的另一项W0尚未确定,一般可采用以下几种方法确定W0如
Wm~1?m~20??2
或者 WN1m~1?N2m~20??~N?N?m 12 或当p(?)1与p(?)2已知时可用
W?~?m1?m~2?2?ln?p(?1)/p(?2)??0?N?2? 1?N2???
当W0确定之后,则可按以下规则分类, T
WX??w0?X??1WTX??w
0?X?? 2 使用Fisher准则方法确定最佳线性分界面的方法是一个著名的方法,尽管提出该方法的时间比较早,仍见有人使用。
(1)W的确定
各类样本均值向量mi m1i?N?x, i?1,2ix?Xi样本类内离散度矩阵Si和总类内离散度矩阵Sw S?(x?mTi?i)(x?mi), i?1,2
x?Xi