精品文档
实验四
——判别分析
一、实验内容
1、实验目的
为研究某地区人口死亡状况,已按某种方法将15个已知样品分为3类,通过对指标及原始数据进行判别分析并建立判别函数,判定另外4个待判样品属于哪类。 2、实验要求
找出较为合适的判别方法,判别待判样品属于哪一类。
二、实验报告
1、问题提出
为研究某地区人口死亡状况,已按某种方法将15个已知样品分为3类,通过判别分析判定另外4个待判样品属于哪类。
2、指标选择
选取以下六项指标: X1:0岁组死亡概率 X2:1岁组死亡概率 X3:10岁组死亡概率 X4:55岁组死亡概率 X5:80岁组死亡概率 X6:平均预期寿命 3、数据来源
表 4-1 原始数据
X1:0岁组死亡概率 X2:1岁组死亡概率 X3:10岁组死亡概率 组别 第 一 组 序号 1 2 3 4 5 1 2 3 4 5 X1 X2 X3 34.16 7.44 1.12 33.06 6.34 1.08 36.26 9.24 1.04 40.17 13.45 1.43 50.06 23.03 2.83 33.24 6.24 1.18 32.22 4.22 1.06 41.15 10.08 2.32 53.04 25.74 4.06 38.03 11.20 6.07 X4:55岁组死亡概率 X5:80岁组死亡概率 X6:平均预期寿命 X4 X5 X6 7.87 95.19 69.30 6.77 94.08 69.70 8.97 97.30 68.80 13.88 101.20 66.20 23.74 112.52 63.30 22.90 160.01 65.40 20.70 124.70 68.70 32.84 172.06 65.85 34.87 152.03 63.50 27.84 146.32 66.80 第 二 组 精品文档
精品文档
1 2 3 4 5 1 2 3 4 34.03 5.41 0.07 32.11 3.02 0.09 44.12 15.12 1.08 54.17 25.03 2.11 28.07 2.01 0.07 50.22 6.66 1.08 34.64 7.33 1.11 33.42 6.22 1.12 44.02 15.36 1.07 5.20 90.10 69.50 3.14 85.15 70.80 15.15 103.12 64.80 25.15 110.14 63.70 3.02 81.22 68.30 22.54 170.60 65.20 7.78 95.16 69.30 22.95 160.31 68.30 16.45 105.30 64.20 第 三 组 待 判 样 品
4、数据处理
经观察分析,表中数据没有错误值或是缺失值,因此不需要进行处理。 5、操作步骤
表 4-2 序号 1 33.06 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1 2 3 4 (1)按照表4-2把数据输入SPSS数据表中。
(2)通过单击Analyze→Classify→Discriminant展开判别分析对话框。
(3)选择group这个变量为被解释变量,移到Grouping Variable(分组变量)框中,精品文档
36.26 40.17 50.06 33.24 32.22 41.15 53.04 38.03 34.03 32.11 44.12 54.17 28.07 50.22 34.64 33.42 44.02 6.34 9.24 13.45 23.03 6.24 4.22 10.08 25.74 11.2 5.41 3.02 15.12 25.03 2.01 6.66 7.33 6.22 15.36 x1 34.16 x2 7.44 x3 1.12 1.08 1.04 1.43 2.83 1.18 1.06 2.32 4.06 6.07 0.07 0.09 1.08 2.11 0.07 1.08 1.11 1.12 1.07 x4 7.87 6.77 8.97 13.88 23.74 22.9 20.7 32.84 34.87 27.84 5.2 3.14 15.15 25.15 3.02 22.54 7.78 22.95 16.45 x5 95.19 94.08 97.3 101.2 112.52 160.01 124.7 172.06 152.03 146.32 90.1 85.15 103.12 110.14 81.22 170.6 95.16 160.31 105.3 x6 group 69.3 1 69.7 1 68.8 1 66.2 1 63.3 1 65.4 2 68.7 2 65.85 2 63.5 2 66.8 2 69.5 3 70.8 3 64.8 3 63.7 3 68.3 3 65.2 69.3 68.3 64.2 精品文档
打开Define Range,在Minimum后填1,在Maximum后填3,表示分为三组;选择x1、x2、x3、x4、x5、x6这六个变量为解释变量,移到Independents框中。再点选Enter independents together(全部变量进入)单选按钮。
(4)选择要求输出的统计量。在主对话框中单击Statistics按钮,展开统计量选择对话框, 选择描述统计量Means,Univariate ANOVAs,函数选择Fisher函数和Unstandardized(非标准化函数),矩阵选择Within-groups correlation,单击Continue返回主对话框。
(5)在主对话框中单击classify按钮,展开分类选择对话框,选择先验概率(All groups equal,所有组相等或根据组的大小计算概率);子选项(display)中选择每个个体的结果(Casewise results),综合表(Summary Table)和“留一个在外”(Leave-one-out classification)的验证原则;协方差矩阵选择Within-groups;作图选择Combined-groups。
(6)单击保存(Save)选项,可以选择保存预测的分类(Predicted group membership)、判别得分(Discriminant scores)以及所属类别的概率(Probabilities of group membership)。
(7)在主对话框中单击OK,提交运行。得到结果部分如下表4-3至表4-8。
表 4-3 各组均值相等的检验 Tests of Equality of Group Means 0岁组死亡概率 1岁组死亡概率 10岁组死亡概率 55岁组死亡概率 80岁组死亡概率 平均预期寿命
表 4-4 贝叶斯判别函数的有效性检验
Wilks' Lambda Test Function(s) 1 through 2 2
表 4-5 非标准贝叶斯判别函数的系数
.010 .591 43.948 4.999 12 5 .000 .416 of Wilks' Lambda Chi-square df Sig. Wilks' Lambda .997 .990 .645 .438 .174 .926 F .019 .061 3.301 7.690 28.557 .478 df1 2 2 2 2 2 2 df2 12 12 12 12 12 12 Sig. .981 .941 .072 .007 .000 .631 精品文档