matlab多元线性回归与逐步回归实验1

《模糊数学》实验报告

实验名称: 多元线性回归与逐步回归

1. 熟练掌握现行回归模型的建模方法,掌握regress命令的使用方法。 实 验 目 的 2. 掌握编程求总离差平方和TSS、回归平方和RSS、残差平方和ESS等相关统计量。 3. 掌握逐步回归的思想与方法,掌握stepwise命令的使用方法。 实验主要内容 (具体题目、解答过程及程序) 一、实验数据与实验内容: 选取1989—2003年的全国的统计数据,考虑的自变量包括:工业总产值(x1),农业总产值(x2),建筑业总产值(x3),社会商品零售总额(x4),全民人口数(x5),受灾面积(x6),国家财政收入(y),单位均为亿元。数据见表3.17。 表1 1989至2003 年统计数据 年份 x1 1989 6484.00 1990 6858.00 1991 8087.10 x2 4100.60 4954.30 5146.40 x3 794.00 859.40 x4 8101.40 8300.10 x5 112704.0 114333.0 115823.0 x6 y 46991.00 2664.90 38474.00 2937.10 55472.00 3149.48 51333.00 3483.37 48829.00 4348.95 55043.00 5218.10 45821.00 6242.20 1015.10 9415.60 1992 10284.50 5588.00 1993 14143.80 6605.10 1994 19359.60 9169.20 1415.00 10993.70 117171.0 2284.70 12462.10 118517.0 3012.60 16264.70 119850.0 1995 24718.30 11884.60 3819.60 20620.00 121121.0 1996 29082.60 13539.80 4530.50 24774.10 122389.0 46989.00 7407.99 1997 32412.10 13852.50 4810.60 27298.90 123626.0 53429.00 8651.14 1998 33387.90 14241.90 5231.40 29152.50 124761.0 50145.00 9875.95 1999 35087.20 14106.20 5470.60 31134.70 125786.0 49981.00 11444.08 2000 39047.30 13873.60 5888.00 34152.60 126743.0 54688.00 13395.23 2001 42374.60 14462.80 6375.40 37595.20 127627.0 52215.00 16386.04 2002 45975.20 14931.50 7005.00 42027.10 128453.0 47119.00 18903.64 2003 53092.90 14870.10 8181.30 45842.00 129227.0 54506.00 21715.25 (1)建立多元回归模型; (2)用逐步回归求国家财政收入y与6个因素的回归关系. 二、实验程序: 程序1 clear,clc A=[6484.00 4100.60 794.00 8101.40 112704.0 46991.00 2664.90; 6858.00 4954.30 859.40 8300.10 114333.0 38474.00 2937.10; 8087.10 5146.40 1015.10 9415.60 115823.0 55472.00 3149.48; 10284.50 5588.00 1415.00 10993.70 117171.0 51333.00 3483.37; 14143.80 6605.10 2284.70 12462.10 118517.0 48829.00 4348.95; 19359.60 9169.20 3012.60 16264.70 119850.0 55043.00 5218.10; 24718.30 11884.60 3819.60 20620.00 121121.0 45821.00 6242.20; 29082.60 13539.80 4530.50 24774.10 122389.0 46989.00 7407.99; 32412.10 13852.50 4810.60 27298.90 123626.0 53429.00 8651.14; 33387.90 14241.90 5231.40 29152.50 124761.0 50145.00 9875.95; 35087.20 14106.20 5470.60 31134.70 125786.0 49981.00 11444.08; 39047.30 13873.60 5888.00 34152.60 126743.0 54688.00 13395.23; 42374.60 14462.80 6375.40 37595.20 127627.0 52215.00 16386.04; 45975.20 14931.50 7005.00 42027.10 128453.0 47119.00 18903.64; 53092.90 14870.10 8181.30 45842.00 129227.0 54506.00 21715.25];%自变量数据 [m,n]=size(A); subplot(3,2,1),plot(A(:,1),A(:,7),'+') xlabel('x1(工业总产值)') ylabel('y(国家财政收入)') subplot(3,2,2),plot(A(:,2),A(:,7),'*') xlabel('x2(农业总产值)') ylabel('y(国家财政收入)') subplot(3,2,3),plot(A(:,3),A(:,7),'o') xlabel('x3(建筑业总产值)') ylabel('y(国家财政收入)') subplot(3,2,4),plot(A(:,4),A(:,7),'+') xlabel('x4(社会商品零售总额)') ylabel('y(国家财政收入)') subplot(3,2,5),plot(A(:,5),A(:,7),'*') xlabel('x5(全民人口数)') ylabel('y(国家财政收入)') subplot(3,2,6),plot(A(:,6),A(:,7),'o') xlabel('x6(受灾面积)') ylabel('y(国家财政收入)') x=[ones(m,1),A(:,1),A(:,2),A(:,3),A(:,4),A(:,5),A(:,6)];%构造设计矩阵 y=A(:,7); [n,p]=size(x);%矩阵x0的行数即样本容量 [db,dbint,dr,drint,dstats]=regress(y,x)%调用多元回归分析命令 TSS=y'*(eye(n)-1/n*ones(n,n))*y%计算TSS H=x*inv((x'*x))*x';%计算对称幂等矩阵 ESS=y'*(eye(n)-H)*y%计算ESS RSS=y'*(H-1/n*ones(n,n))*y%计算RSS MRS=RSS/p%计算MRS MSE=ESS/(n-p-1)%计算MSE %F检验 F0=(RSS/p)/(ESS/(n-p-1))%计算F0 程序2: X=[A(:,1),A(:,2),A(:,3),A(:,4),A(:,5),A(:,6)]; stepwise(X,y,[1,2,3,4,5,6],0.05,0.10) %in=[1,2,3,4,5,6]表示x1、x2、x3、x4、x5、x6均保留在模型中 三、实验结果与分析: ⒈多元回归模型 运行程序可得到国家财政收入与各因素的散点图(见图1)。 y(国家财政收入)420y(国家财政收入)x 104420x 1040x 10424x1(工业总产值)6x 1040x 104500010000x2(农业总产值)15000y(国家财政收入)420y(国家财政收入)y(国家财政收入)4200x 105000x3(建筑业总产值)4100000y(国家财政收入)42420246x4(社会商品零售总额)4x 104x 1001.11.151.21.25x5(全民人口数)1.3x 105345x6(受灾面积)6x 104图1 国家财政收入与各因素的散点图 得到?的最小二乘估计(见表2)及方差分析表(见表3): 表2 ?的最小二乘估计 变量 值 ?0 ?1 ?2 ?3 ?4 ?5 ?6 -6922.6 0.1 -0.9 0 0.6 0.1 0 表3 方差分析表 方差来源 平方和 自由度 回归 5.2695e+008 6 误差 1.1322e+006 8 总计 5.2808e+008 14 均方和 F 7.5278e+007 465.4205 1.6174e+005 p 0 F检验:H0:?1??2??3??4??5??6?0H1:?i(i?1,2,3,4,5,6)不全为0 由表2可知,统计量F0?465.4205,在显著性水平??0.05,查F分布表,得临界值F??3.1122。由F0?F??3.1122,所以拒绝H0,接受备择假设。则总体回归系数不全为0,即表明模型的线性关系在95%的置信水平下显著成立。

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4