§5 化妆品销售量的预测
某公司在各地销售一种化妆品,观测15个城市在某月内对该化妆品的销售量Y及适合使用该化妆品的人数x1和人均收入x2。数据见下表:
城市 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 销售量(箱)yi 162 120 223 131 67 169 81 192 116 55 252 232 144 103 212 适用人数(千人)xi1 人均收入(元)xi2 274 180 375 205 86 265 98 330 195 53 430 372 236 157 370 2450 3254 3802 2838 2347 3782 3008 2450 2137 2560 4020 4427 2660 2088 2605 要求通过以上数据建立预测模型,当已知任一个城市的适用人数和人均收入(x1,x2)时,能够预测在这个城市的销售量。
这个问题本质上就是多元线性回归模型,如果随机变量Y与固定变量x1,x2,?,xm之间有显著的线性相关关系,即
Y?b0?b1x1?b2x2???bmxm??,?~N(0,?2)
称为m元线性回归模型。 一、模型中的参数估计
设通过实验或历史资料得到观测数据(yi,xi1,xi2,?,xim),(i?1,2,?,n)。令
?y1????y?Y??2?,????y??n?由最小二乘估计,得
?1x11??1x21X??????1xn1?x12x22?xn2?x1m??b0?????x2m??b1?,B? ??????????b??xnm???m???(XTX)?1XTY B??b?x?b?x???b?x为变量Y关于变量x,x,?,x的线性回归方程。 ??b称y12m01122mm同样还可以得到?的估计量为
2
n1???i)2 ?(yi?y?n?m?1i?12??b?x?b?x???b?x(i?1,2,?,n)。 ?i?b这里y01i12i2mim二、回归模型的显著性检验
1、检验回归模型的显著性
即检验假设 H0:b1?b2???bm?0,令 SR? H1:bi不全为零n??(yi?1ni?i)2 ?y),Se??(yi?y2i?1检验统计量 F?SR/m~F(m,n?m?1)Se/(n?m?1)
对一个小概率?,若F?F?(m,n?m?1),则认为所建的回归方程有意义。 2、各自变量的显著性检验,剔除变量计算 即检验假设 H0j:bj?0,检验统计量 tj?H1j:bj?0(j?1,2,?,m) ?bj~t(n?m?1)(j?1,2,?,m)
cjjSe/(n?m?1)这里cjj是矩阵C?(XTX)?1中相应位置的元素。对一个小概率?,若tj?t?(n?m?1),则
2应保留变量xj,否则应剔除变量xj。剔除变量时,从tj最小的开始,直到不显著的变量全部剔除为止。设tk?mintj,则剔除xk,重新建立回归方程如下:
?*?b?*x???b?*x?b?*x???b?*x ??by011k?1k?1k?1k?1mmckj?*??其中 bj?bj?bk,(j?1,2,?,m,j?k)
ckk?*?y? b0?x?b*jj?kj
三、利用回归方程进行预报
当(x1,x2,?,xm)?(x01,x02,?,x0m)时,对Y进行预测。
??b?x?b?x???b?x ?0?b1、点预测 y0101202m0m?0??(x0),y?0??(x0)),其中 2、区间预测 Y的置信度为1??的置信区间(y1mm?1????(x0i?xi)(x0j?xj)cij ?(x0)?t?(n?m?1)?ni?1j?12现在用上面的回归模型来解决前面提出的问题:
?162???120??Y??,?????212????12742450???11803254?? X?????????13702605?????(3.4526??3.4526?0.496x1?0.0092x2。 得到B,0.4960,0.0092)T,所求回归方程是y又求得SR?53844.72,Se?56.88,从而
F?SR/m?5680?F0.05(2,12)?3.89
Se/(n?m?1)?1.24632.1297?10?4???7.7329?10?6???4.1567?10?4???7?7.0303?10? 1.9772?10?7??故认为所建的回归方程有意义。
C?(XTX)?1又可求出
t1?0.49604.74?7.7329?100.00924.74?1.9772?10?7?6?81.93?t0.025(12)?2.179
t2??9.50?t0.025(12)?2.179
说明x1,x2对Y均有显著的线性影响,均不能剔除。
下面给出预测方法:例如当某城市的数据(x1,x2)?(220,2500)时,有
?0?3.4526?0.496?220?0.0092?2500?135.57 y1mm?1????(x0i?xi)(x0j?xj)cij?4.972 又 ?(x0)?t0.025(12)?ni?1j?1?0??(x0),y?0 ??(x0)),即在130到140可以95%的把握认为这种化妆品在该城市的销售量在(y箱之间。