表9 以效率等级3为对照的Logistic回归分析结果
Te 4
因素 Intercept 受教育程度 外资比重 科技支出比例 教育费比例 医疗卫生费比例 社会保障比例 第二产业 第三产业
B -3.237 10.192 -51.815 -115.287 -21.118 23.666 -19.690 14.015 7.582
SE 5.719 11.138 26.575 67.353 12.446 20.277 8.262 6.163 8.300
Wald 0.320 0.837 3.802 2.930 2.879 1.362 5.680 5.171 0.834
P值 0.571 0.360 0.051 0.087 0.090 0.243 0.017 0.023 0.361
OR值
26682.554 3.1393E-23 8.541E-51 6.7361E-10 1.8964E+10 2.8091E-09 1.220E+06 1962.733
8.82792E-06 7.52223E-46 3.9881E-108 1.71478E-20 1.04341E-07 2.60628E-16
6.929 0.000 OR值的95% CI 上限
8.06485E+13
1.310 1.829E+07 26.461 3.44669E+27
0.030 2.14946E+11 2.280E+10 下限
模型结果分析:
1.因为都是以等级相对较高的效率作对照,所以在指标有统计学意义的前提下参数估计值小于0(表中用红色标记),即表明该指标对该等级效率有促进作用;估计值大于0(表中用蓝色标记)表明该因素对该效率有抑制作用。
2.各表中对效率有促进作用的因素所对应的OR值远远小于1,而对效率有抑制作用的因素所对应的
OR值远远大于1,这说明这些因素的促进作用或抑制作用相当明显。至于为什么OR值会如此大或如此
小?那是因为我们所选取的影响因素全部用的是比值,而这个比值对应的具体财政数据有很大。比如表7中第3级效率与第1级效率比较时外资占固定资产的比重对效率有促进作用,相应的OR值接近于0,说明当其他因素不变而外资比重增加一个单位时第1级效率的发生比远远高于第3级效率的发生比。发生比如此大是由具体数据决定的。比如2009年四川的外资额为50.2亿元,它所占固定资产的比重为0.4%,所以当这个比重增加1%,实际投入的外资额超过100亿元,那它对效率的促进作用是非常明显的。这就是OR值有点“离谱”的原因。
3.各回归分析表中还有一个共同的现象:相邻两个等级的效率作比较时,有统计学意义的指标较少;等级差别较大的效率作比较时,有统计学意义的指标相对较多。这表明这些没有统计学意义的因素在处于相邻效率等级的省、市之间的水平是没有差别的。例如:效率等级2跟1比较时,外资比重、科技支出比重等指标都不具有统计学意义,这就表明处于效率等级1的北京、上海等省、市跟处于等级2的浙江、江苏等省、市在吸引外资以及科技投入等方面的情况是很相似的,所以这些因素才没有统计学差异。
4.第2等级效率与第1等级效率比较时(表7),只有受教育程度有统计学意义,并且回归系数B值
16
小于0,说明改善受教育程度水平可以促进第2级效率的增长。所以处于第2级效率的省、市可以加大吸收高技术、高科技人才的力度来提高本省的经济效率。
5.第3等级效率与第1等级比较时(表7),受教育程度、外资比重等因素可以促进第3等级效率增长,卫生经费比重会抑制其增长;第3级效率与第2级效率比较时(表8),外资比重可以促进第3级效率的增长。所以要促进第3级效率的增长,相应省、市有关部门可以吸收更多的高技术、高科技人才,或者吸引更多的外商投资。医疗卫生费用比重对效率有抑制作用,并不是说我们要减少医疗卫生方面的投入,而是指根据现有的经济结构和资源配置情况,盲目地增加医疗卫生方面的投入有可能会降低经济效率。
6.第4等级效率与第1等级效率比较时(表7),外资比重、科技支出等因素对第4级效率有促进作用,医疗卫生费用、第二产业等因素对第4级效率有抑制作用;第4等级效率与第2等级效率比较时(表8),外资比重、科技支出、社会保障支出等因素对第4级效率有促进作用,第二产业所占GDP的比重对第4级效率有抑制作用;第4等级效率与第3等级效率比较时(表9),社会保障支出对第4级效率有促进作用,第二产业所占GDP的比重对第4级效率有抑制作用。但是这里的抑制作用跟医学上有所不同,比如第二产业对效率的抑制作用是指在现有的经济结构下,扩大第二产业的规模已不能再促进经济效率的增长,但是如果我们能促进技术进步,优化资源配置或调整产业结构,那现在体现抑制作用的因素在将来有可能变成促进效率增长的因素。
7.第4等级效率在跟不同等级效率比较时,所得出的影响因素稍有不同,这主要是由于地区差异引起。因为不同等级效率之间比较意味着不同省、市之间的比较。而处于第4等级效率的省、市大部分属于西部欠发达地区,要提高这些地区的经济效率,需要在外资、科技、社会保障等各方面加大投入力度。如果不能改善这些地区在科技、人才、社保方面的情况,仅仅扩大第二产业的规模,不仅不能促进经济效率,反而会造成资源浪费。
8.无论以哪个等级效率为对照,各省市教育费支出占财政支出的比重以及第三产业比重均没有统计学意义。因为教育费用支出的多少并不能代表人口受教育程度的高低,所以教育费用支出比重并不能直接影响经济效率;第三产业主要是指服务业,此研究结果说明它的规模大小对效率没有实质性的影响。
17
四 模型评价与讨论
4.1优点与评价
1.Malmquist指数对我国各年效率进行动态测算,较为准确地描述了我国经济的实际发展态势,对于准确把握我国当今经济发展的局势,预测我国未来经济的发展趋势,制定相应指导措施有着重要意义。
2.综合效率的测算较为全面展现了我国在发展过程中出现的省区经济发展不平衡,准确地评判出我国DEA相对有效的三大省市——北京、上海、广东,同时给出较为符合我国经济地区差异实际状况的结论——东部各省相对较发达,中部各省区发展水平一般,而西部各省区欠发达。
3.Logistic回归模型常常应用于医学领域,本次研究我们将其应用于经济数据也算是一个小小的创新。并且我们通过对效率分级,然后以不同等级效率为对照进行Logistic回归分析,能充分挖掘出数据背后隐藏的信息。在我们所研究的8个因素中自始至终只有2个因素没有统计学意义,并且结合实际情况后都能很好解释。所以我们有理由相信这次应用多分类Logistic回归模型分析经济数据是成功的。
4.2不足与讨论
1.由于DEA模型在指标选择方面没有一个统一的标准,所以我们在测算效率时选择的指标可能未能全面涵盖整个社会总投入与总产出,因此测算出的效率与实际情况有一定误差,这是不可避免的。
2.关于国民经济增长的数据因为影响因素较为复杂,所以一般情况很难找到一个理想的模型,本文先将综合效率分级作为因变量,之后应用多分类的Logistic回归,因选取的自变量全为比值,所以在对回归结果中OR值的解释上出现一些困难,但若能结合具体财政数据则比较容易理解。
3.本文虽提出了省区间导致效率差异的因素,也提出了提高欠发达地区效率的部分措施,但考虑到省区间经济发展差异作为一个复杂的多因素系统,受国家政策、自然环境等诸多因素的影响,我们也只能给出一些微不足道的建议,未能系统全面地给出促进地区效率增长的措施,希望决策者在做决策时本研究结果能起到一定的参考作用。
4.因为DEA模型算出的是相对效率,所以在做回归时我们也未能对效率最高的省市(北京、上海、广东)提出具体的效率改进措施。
18
五. 附录
5.1 参考文献:
【1】 朱强,周应恒,范金,中国知识经济的区域比较研究,上海经济研究2009.
【2】 方先明,孙兆斌,张亮,中国省区经济经济效率及其影响因素分析,当代经济科学2008. 【3】 李军军,周利梅,基于聚类分析视角的我省域经济综合竞争力研究,福建师范大学报(哲学社会科学版)2008.
【4】 楼海淼,孙秋碧,基于因子分析的我国各省经济活力评价研究,神州大学学报(哲学社会科学版)
2005.
【5】 叶世绮,颜彩萍,莫剑芳,确定DEA指标体系的B-D方法,暨南大学学报(自然科学自版)2004. 【6】 钟华,安新颖,汪凌勇,国家R&D投入效率评价的实证方法,重庆大学学报(社会科学版)2011. 【7】 王家庭,赵亮,我国分省区城市化效率的实证研究,同济大学学报(社会科学版) 2009. 【8】 郭海涛,于琳琳,李经涛,我国资源型城市效率的DEA方法评价,中国矿业 2007. 【9】 樊宏,林健,中国14省区经济运行效率评价,统计与决策 2006. 【10】杜栋,庞庆华,现化综合评价方法与案例精选,清华大学出版社2005. 【11】杜强,贾丽艳,SPSS统计分析从入门到精通.人民邮电出版社 2009.
【12】黄爽,安胜利,应用SPSS软件进行多分类Logistic回归分析,数理医药学杂志 2001.
【13】樊震林,黎爱军,吴宏等,医疗风险影响因素的有序多分类Logistic回归分析, 中国卫生质量管理
2009.
【14】王全众,两类分析相关数据的Logistic 回归模型,统计研究2007. 【15】刘韵源,与年龄有关的Logistic回归理论及应用,中国科学 1990.
【16】金皓,王倩,高血压病的风险因素分析与研究,应用数学与计算数学学报 2002.
【17】陈京萍 ,徐 谦 ,陈新林等,高校教师健康状况影响因素的多分类Logistic回归分析,安徽中
医学院学报 2011. 【18】王国梁,齐雁云,于世祥,分类数据的?2检验及Logistic回归,统计与信息论坛·现代统计分
析案例荟萃专辑 1996.
【19】高 歌,张明芝,多分类有序反应变量Logistic 回归及其应用, 同济大学学报 2003. 【20】华栋,陈希镇,Logistic模型中参数估计及其模拟研究,中国考试 2008.
【21】Bai Zhidong,P.R.Krishnaiah(1991)Variable selection in Logistic regression,中国科学技术大学学报 1991. 【22】韩俊林, 汤秋云,Logistic 回归模型的Bayes 分析,山西师范大学学报(自然科学版) 2004.
19
5.2 数据
5.2.1 DEA模型数据
省份 安 徽 北 京 福 建 甘 肃 广 东 年份 2001 2001 2001 2001 2001 地区生产总值(亿元)
10062.82 12153.03 12236.53 3387.56 39482.56 就业人数(万人)
3689.70 1255.10 2168.90 1406.60 5643.30 资产总额(亿元)
4914.20 5256.20 6819.70 1916.00 14949.00 电力消费量(亿千瓦小时)
952.31 739.15 1134.92 705.51 3609.64 广 西 2001 贵 州 2001 海 南 2001 河 北 2001 河 南 2001 黑龙江 2001 湖 北 2001 湖 南 2001 吉 林 2001 江 苏 2001 江 西 2001 辽 宁 2001 内蒙古 2001 宁 夏 2001 青 海 2001 山 东 2001 山 西 2001 陕 西 2001 上 海 2001 四 川 2001 天 津 2001 新 疆 2001 云 南 2001 浙 江 2001 重 庆 2001 安 徽 2002 北 京 2002 福 建 2002 甘 肃 2002 广 东 2002 广 西 2002 贵 州 2002 海 南 2002 河 北 2002 河 南
2002
7759.16 2862.60 3912.68 2341.10 1654.21 431.40 17235.48 3899.70 19480.46 5948.80 8587.00 1687.50 12961.10 3024.50 13059.69 3907.70 7278.75 1184.70 34457.30 4536.10 7655.18 2244.10 15212.49 2190.00 9740.25 1142.50 1353.31 328.50 1081.27 285.50 33896.65 5449.80 7358.31 1599.60 8169.80 1919.50 15046.45 929.20 14151.28 4945.20 7521.85 507.30 4277.05 829.20 6169.75 2730.20 22990.35 3825.20 6530.01 1878.50 8851.66 3594.60 11115.00 1173.80 10823.01 2079.80 3166.82 1388.70 36796.71 5478.00 7021.00 2807.20 3561.56 2301.60 1503.06 412.10 16011.97 3651.70 18018.53
5835.50
5795.80 2100.50 914.20 9264.80 13304.10 5027.80 6827.00 6773.40 6074.50 17571.90 4163.40 9412.00 7495.40 1308.80 798.20 18110.00 4910.70 5447.20 6766.00 7696.60 5459.90 2549.80 3756.60 10607.30 3818.60 4382.96 4301.55 5975.76 1958.54 12969.83 3890.41 1750.70 757.62 8368.99 10885.30
20
856.35 750.30 133.77 2343.85 2081.38 688.67 1135.13 1010.57 515.25 3313.99 609.22 1488.17 1287.93 462.96 337.24 2941.07 1267.54 740.11 1153.38 1324.61 550.16 547.88 891.19 2471.44 533.80 858.88 689.72 1073.55 677.76 3504.82 753.39 679.18 121.72 2095.02 1970.77