基于多元线性回归方法对国内旅游业分析
丁雪琪
(东北农业大学,哈尔滨150030)
摘要:随着经济的发展,人民的生活水平也发生了很大的变化,经济的发展带动了人民消费观念的改变。民航一直是交通运输中的一种不可少的方式,一定程度上也反映了人民的生活水平的提高,此题主要研究我国民航客运量的变化趋势及其成因,数据来源于《2010年统计摘要》,利用spss软件拟合数据,主要是根据线性回归和非线性回归的知识分析利用软件得出的结果。 关键词:(非)线性回归、相关性、最小二乘估计、逐步回归
0引言:
研究这种一个随机变量同多个变量之间关系的方法主要是多元回归分析法影响民航客运量的因素很多,主要有经济因素(主要包括国民总收入、人均国内生产总值等)、民航等运输行业因素(主要包括各种交通运输方式的客运总量、航空设施和服务、航空费用的变动、航空运输业职工人数等)、人民生活因素(主要包括居民可支配收入、居民交通消费等)。首先,经济的发展是首要因素,因为经济发展的整体水平和规模是民航业的根本决定性因素;另外,经济增长速度越快、经济越活跃,就越需要提高人们出行办事的效率,因此,快捷的飞机就会被更多的人所考虑;民航客运量与国民经济发展之间存在着相关关系.其次,民航业的发展将导致民航客流量的增加,民用飞机架数、飞机场数量、民用航空航线条数等增加,机票折扣价的推出,加上飞机本身快捷、舒适、安全的特点,都将吸引更多的旅客;另外燃料价格的增加、其它运输方式的发展都将对人们的出行选择产生影响;因此与客运量之间存在着相关关系.最后,人民生活水平提高了,可支配收入增加了,才有能力接受相对更贵的飞机票,故这也是一个重要的影响因素.这些因素影响着民航客运量的增长或减少,影响因素和民航客运量之间存在着一种内在的、隐含的映射关系,由于各影响因素对民航客运量的影响角度和程度不尽相同,所以这种复杂的内在关系决定了各影响因素与民航客运量之间的多元非线性映射关系。
1 研究方法与数据来源
1.1多元统计分析的原理及模型[1]:
设影响因变量y的自变量个数为m个,记为y??0.01x3?27.109x4?0.295x5多元线性模型是指这些自变量对y的影响是线性的,即关系式
y??0??1x1??2x2??3x5?....??mxm??(1)其中:?0,?1,?2....?m 是m?1个未知参数,?0为常数项,?1,?2,...,?m 称为回归系数;x1,x2,x3,...,xm 是m个可得到精确值并能够控制的一般变量,称为解释变量,称y为对自变量x1,x2,x3,...,xm 的线性回归函数。当m?1时,式(1)为一元线性线性回归模型,m?2时,称为多元线性回归模型。?是随机误差,通常认为?~N0,?2。在实际问题中,获?y1??0??1x11??2x12?...??px1m????y2??0??1x21??2x22?...??px2m????.?.?y??0??1xn1??2xn2?...??pxnm??得n组观测数据,则??ni?1,2,...,n,这个模型称为多元线性回归模型。
??,其中,
?y1??1???y?2??1Y??.?,X??1????.??????1y??n?
x11x21x31?xn1
x12x22x32?xn2
...x1m??...x2m?...x3m??...??...xnm??
,
??0???1??????????????1?,???2?????????n?????? ?m?
则上述模型的矩阵形式为:Y?X???。
1.2 指标选取
本文指标及原始数据全部来自于中国统计年鉴(2010).限于篇幅,原始数
据在此略去.如何选取典型的指标变量来反映交通运输业与旅游业的竞争力是一个关键性问题.根据系统性原则、科学性原则和可操作性原则,同时考虑到数据选取的权威性、可靠性和数据获取的难易程度,本文分别选用6个评价指标作为全面反映影响民航客运量的相关因素.具体所取指标如下:
; x1——国民收入(亿元)
x2——消费额(亿元); x3——铁路客运量 (万人);
x4——民航航线历程(万公里); x5——来华旅游入境人数(万人);
; R2——国内旅游总人数(万人)
x7x8————交通运输业从业人数(万人); 国内旅行社数量(万个);
x9——私人汽车拥有量(万辆).。
2 实例分析---民航客运量回归模型的建立与检验
2.1 实例研究背景
2000年民航客运量达67222万人次,在此背景下,中5年内中国民航将再购进飞机400多架。此消息一出便引来各方关注,讨论得最多的便是这个决策的可行性。到时民航飞机总数也将达到800架。这就不得不考虑到运力过剩问题。因此,如何对这一决策的科学性进行论证显得非常有必要。因此本文将根据历年来的统计资料,建立回归分析模型,对这一问题进行定量的分析研究,为这一问题的探讨与解决提供一定思路。 2.2 模型估计:
本文采用多元线性回归模型作为分析的基本模型: y??0??1x1??2x2??3x5?....??mxm?? 采用OLS 估计方法结果为:
[2]
表1 基本统计量
Model
R
R Square
Adjusted R Square
1
.999
.998
.996
Std. Error of the Estimate
60.703
Durbin-Wat
son 2.111
表2 相关系数矩阵 y
y
Correlation P值
1.00
0
x1 x2
.989 .000 1.0
x3 x4
.987 .000 .984
x5
.918 .000 .924
x6 x7 x8 x9
.985 .211 .000 .216 .999 .242
.966 .969 .000 .000 .981 .978
.901 .990 .000 .000 .923 .992
x1 Correlation .989
00
P值 .000 .000 .183 .000 .000 .000 .000 .000 .000
.985 x2 Correlation
.999 .000
1.00
0
.273 .153
.978 .000
.937 .000
.988 .983 .000 .000
.938 .988 .000 .000
P值 .000
x3 Correlation
P值
.211 .216
.242 .183
.273 1.00
0
.153
.200 .229
.502 .024
.330 .355 .106 .089
.500 .162 .024 .275
x4 Correlation .987
P值
.000
.984 .000 .924
.978 .200 1.00
0
.877 .951 .961 .883 .987
.000 .229 .937 .502
.877
.000 1.00
0
.000 .000 .963 .953
.000 .000 .966 .891
x5 Correlation .918
P值
.000
.000 .981
.000 .024 .988 .330
.000 .951
.963
.000 .000 1.00
0
.993
.000 .000 .973 .969
x6 Correlation .966
P值
.000
.000
.000 .106 .000 .000 .000 .000 .000
x7 Correlation .969
P值
.000
.978 .000
.983 .355 .000 .089
.961 .000
.953 .000
.993 1.00
0
.000
.973 .972 .000 .000
x8 Correlation .901
P值
.000
.923 .000
.938 .500 .000 .024
.883 .000
.966 .000
.973 .973 .000 .000
1.000
.901 .000
x9 Correlation .990
P值
.000
.992 .000
.988 .162 .987 .891 .969 .972 .901 1.00
0
.000 .275 .000 .000 .000 .000 .000
表3 回归方程方差分析
ANOVAb Sum of Model 1 Regression Squares 13819203.569 df Mean Square F Sig. .000a 8 1727400.44461.398 6