Matlab软件包与Logistic回归
在回归分析中,因变量y可能有两种情形:(1)y是一个定量的变量,这时就用通常的regress函数对y进行回归;(2)y是一个定性的变量,比如,y?0或1,这时就不能用通常的regress函数对y进行回归,而是使用所谓的Logistic回归。
Logistic回归的基本思想是,不是直接对y进行回归,而是先定义一种概率函数?,令
??Pr?Y?1|X1?x1,X2?x2,???,Xn?xn?
要求0???1。此时,如果直接对?进行回归,得到的回归方程可能不满足这个条件。在现实生活中,一般有0???1。直接求?的表达式,是比较困难的一件事,于是,人们改为考虑
1????y?1的概率?k
y?1的概率一般的,0?k???。人们经过研究发现,令
??Pr?Y?1|X1?x1,X2?x2,???,Xn?xn??11?a?e?b1X1?????bnXn
?a?0,bj?0?
即,?是一个Logistic型的函数,效果比较理想。于是,我们将其变形得到:
?1??log???然后,对log?????b0?b1x1?????bnxn ?1????进行通常的线性回归。 ???
1
例1 企业到金融商业机构贷款,金融商业机构需要对企业进行评估。例如,Moody公司就是New York的一家专门评估企业的贷款信誉的公司。设:
?0,企业2年后破产 y??1,企业2年后具备还款能力?下面列出美国66家企业的具体情况: Y 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
X1 X2 X3
-62.8 -89.5 1.7 3.3 -3.5 1.1
-120.8 -103.2 2.5 -18.1 -3.8 -61.2 -20.3 20.8 -39.4
-28.8 -50.6 -56.2 -17.4 -4.3 -35.7
1.1 0.9 1.7 1.0 0.5 1.0 1.5 1.2 1.3 0.8 2.0 1.5 3.4 1.3 1.6 0.3 0.8 0.9 1.7 1.3 2.1 2.8 2.1 0.9 1.2
-194.5 -25.8 -106.1 -22.9 -164.1 -17.7 -308.9 -65.8 7.2
-22.6
-118.3 -34.2 -34.6 -27.9 -48.2 -49.2 -19.2 -18.1 -98.0 -4.0 -8.7 -59.2 -13.1 -38.0
-19.4 6.3 6.8 -17.2 -36.7 -6.5 -20.8 -15.8 -36.3 -12.8 -17.6 1.6
-185.9 -280.0 6.7
-129.0 -14.2
2
0 -57.9 0.7 0.8 0 -8.8 -9.1 0.9 0 -64.7 -4.0 0.1 0 -11.4 4.8 0.9 1 43.0 16.4 1.3 1 47.0 16.0 1.9 1 -3.3 4.0 2.7 1 35.0 20.8 1.9 1 46.7 12.6 0.9 1 20.8 12.5 2.4 1 33.0 23.6 1.5 1 26.1 10.4 2.1 1 68.6 13.8 1.6 1 37.3 33.4 3.5 1 59.0 23.1 5.5 1 49.6 23.8 1.9 1 12.5 7.0 1.8 1 37.3 34.1 1.5 1 35.3 4.2 0.9 1 49.5 25.1 2.6 1 18.1 13.5 4.0 1 31.4 15.7 1.9 1 21.5 -14.4 1.0 1 8.5 5.8 1.5 1 40.6 5.8 1.8 1 34.6 26.4 1.8 1 19.9 26.7 2.3 1 17.4 12.6 1.3 1 54.7 14.6 1.7 1 53.5 20.6 1.1 1 35.9 26.4 2.0 1 39.4 30.5 1.9 1 53.1 7.1 1.9 1 39.8 13.8 1.2 1 59.5 7.0 2.0 1 16.3 20.4 1.0 1
21.7
-7.8
1.6
其中,
X1?未分配利润总资产X2?支付利息前的利润总资产建立破产特征变量y的回归方程。 解:在这个破产问题中,
3
X3?销售额总资产