精品文档
(3) 当x=12.25克时,Z=
x??0
?/n
x??0
=
12.25?120.6/2511.95?120.6/25=2.08。
由于|z|=2.08>1.96,拒绝H0:μ=120;应该对生产线停产检查。
(4) 当x=11.95克时,Z=
=
=-0.42。
?/n
由于|z|=-0.42<1.96,不能拒绝H0:μ=120;不应该对生产线停产检查。
第9章 分类数据分析
一、单选:1.C 2.A 3.B 4.D 5.A 6.A 7.D
8.(1)B (2)B (3)D (4)A (5)A (6)B (7)A (8)A (9)C 9.A 10.A 11.C 12.B
二、简答:
1.答:在?检验的理论公式?22???A?T?T2中,A为实际频数,T为理论频数。根据检验假设H0:π1=π2,若H0 成
22立,则四个格子的实际频数A与理论频数T相差不应很大,即?统计量不应很大。若?值很大,即相对应的P值很小,比如
P≤a,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,
即π1≠π2。
2.答:R?C表?检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。 3.答:
(1)条件百分表的方向。通常情况下,变量在列联表中的位置是任意的,但如果变量X与Y之间存在因果关系,则令X为自变量,通常放在列的位置,Y为因变量,通常放在行的位置。条件百分表也多按照变量的方向计算。
(2)?分布的期望频数准则。在对?分布进行独立性检验时,要求样本容量必须足够大,特别是每个单位中的期望频数不能过小,必须注意两个准则:
准则一:如果只有两个单元,每个单元的期望频数必须是5或5以上; 准则二:对于两个以上的单元,如果20%的单元期望频数决。
4.(1)方差分析是通过检验各样本总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。涉及两个类型的变量,分类型的自变量和数值型因变量。它通过对数据误差来源的分析以判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响。这种误差一方面来源于组内误差,主要是不同水平(或处理)内的样本随机性所造成的;另一方面来源于组间误差,主要体现为不同水平之间的数据误差,这可能是由于抽样本身随机误差形成的,也可能是不同水平间的系统性因素造成的系统误差。
(2)列联分析是利用列联表来分析变量之间关系的一种统计方法,主要是借助于?统计量对列联表中变量间的相关性进行检验,仅仅涉及到分类型变量以及相关的频数分布。主要是借助于真实频数和期望频数之间的差异情况来计算?统计量,与给定显著性水平下的?临界值比较,以判断各类型的分布之间是否存在差异性。 三、计算:
1.解:根据题意提出假设,
222222fe2?小于5,则不能应用检验。这可以采用合并一些单元的方式解
H0:各数字出现的比例是一致的
H1:各数字出现的比例是不一致的
计算?统计量,
2f0 21 15 13 17 19
.
fe 100/6 100/6 100/6 100/6 100/6
(f0?fe)21.127 0.167 0.807 0.007 0.327
fe ?2
精品文档
15
100/6
0.167
2.602
(f0?fe)2???fe2=2.602
给定显著性水平??0.05,查自由度为5的?2分布表,得临界值?02.05(5)?11.071。
2另一方法,就是利用Excel中的函数=CHIDIST(?,自由度)计算p-值为0.7614。 由于?22??0.05(5)?11.071或p-值大于显著性水平,故不拒绝原假设,说明各数字出现的比例是一致的,这也就说明此骰
子是公平的,所出现的频数差异是由于投掷的随机性造成的。 2.根据题意提出假设,
H0:样本与期望比例一致(或,0.15,0.3,0.5,0.05是消费者的购买概率)
H1:样本与期望比例不一致(或,0.15,0.3,0.5,0.05不是消费者的购买概率)
计算?统计量,
2f0 120 320 500 60
2fe 150 300 500 50
(f0?fe)26 1.333 0 2
fe ?2 9.333
(f0?fe)2???fe给定显著性水平?2=9.333
?0.05,查自由度为3的?2分布表,得临界值?02.05(3)?7.815。另一方法,就是利用Excel中的函数
=CHIDIST(?,自由度)计算p-值为0.025。 由于?22??0.05(3)?7.815或p-值小于显著性水平,故拒绝原假设,说明样本与期望分布不一致。
3.(1)根据题意提出假设,
H0:学生态度与所在年级无关,即各年级的态度比例一致;
H1:学生态度与所在年级有关,即各年级的态度比例不一致
计算?统计量,?给定显著性水平?22?2.447。
?0.05,查自由度为3的?2分布表,得临界值?02.05(3)?7.815。
2另一方法,就是利用Excel中的函数=CHIDIST(?,自由度)计算p-值为0.4850
第10章 方差分析
一、单选:1.D 2.A 3.C 4.C 二、多选:1.ACE 2.ABD 3.BE 4.AD 三、填空: 1.独立、方差
2.总变差平方和=组间变差平方和+组内变差平方和。 3.数量型变量,品质型变量,数量型变量。 4.正态总体均值 5.因子,水平或处理。 6.组间、组内 7.m-1, n-m。 四、计算题
1.解:
根据计算结果列出方差分析表
方差来源 组间 组内 总和 . 离差平方和 0.001053 0.000192 0.001245 自由度 2 12 14 均方差 0.00052661 0.00016 F值 32.92 精品文档
因为 (2,12)=3.89<32.92,故拒绝 ,认为各台机器生产的薄板厚度有显著差异。 2.解:
根据计算结果列出方差分析表 方差来源 组间 组内 总和 离差平方和 14245.83 43950 58195.83 自由度 3 20 23 均方差 4748.61 2197.5 F值 2.16 因为 (3,20)=3.10>2.16,故接受 ,即四种配方的饲料对小鸡的增重没有显著的差异。 3.解:各总值均值间有显著差异。 4.解:差异不显著。
第11章 一元线性回归
一、单选: 1.D 2.A 3.B 4.A 5.C 6.A 7.B 8.C 9.B 10.C
11.A 12.A 13.B 14.A 15.C 16.A
二、多选: 1.ABD 2.AE。 三、判断:
1.×。这种正相关是因为二者同时受到疾病的严重程度的影响所致。
2.√。因为用最小平方法在现有资料范围内配合的最佳方程,推到资料范围外,就不一定是最佳方程。 四、简答:
1.答:变量之间存在的不确定的数量关系为相关关系,可能还会有其他很多较小因素影响;特点是一个变量的取值不能由另一
个变量唯一确定。
2.答:变量性质不同,相关分析不必区分自变量和因变量,而回归分析必须区分;作用不同,相关分析用于测度现象之间有无
相关关系、关系方向、形态及密切程度,而回归分析是要揭示变量之间的数量变化规律。 五、计算: 1.解:(1)
10年5薪00 (2)建立线性回归方程?y??0??1x,根据最小二乘法得: 246810受教育年数2???1214 ?1?n?xiyi??xi?yin?x?(?xi)2i;?0??y?ni??1???xni
由此可得?1=0.732,?0=-2.01,则回归方程是
???y=-2.01+0.732x
(3)当受教育年数为15年时,其年薪的点估计值为:
y=-2.01+0.732×15=8.97(万元)
估计标准误差:
Sy=
(y?i2?yi)?n?2?=
SSE=MSEn?2=
0.538=0.733
置信区间为:
y?t?/2Sy(x0?x)21?nn?(xi?x)2i?1
=8.97±2.228×0.733× =8.97±1.290
21(15?6.917) ?12120.9167.
精品文档
预测区间为:
y?t?/2Sy?(x0?x)211??nn?(xi?x)2i?1
=8.97±2.228×0.733× =8.97±2.081 2.解:(1)建立线性回归方程
21(15?6.917) 1??12120.9167????x,根据最小二乘法得: ???y011??n?xiyi??xi?yi???22?1nx?(x)??ii? ??yi??xi?????1??0?nn??
由此可得?0=0.0093,?1=0.316,则回归方程是
??y=0.0093+0.316x
?(3)当GDP达到16时,其货币供应量的点估计值为:
y=0.0093+0.316×16=5.065亿元
估计标准误差:
Sy=
(y?i2?yi)?n?2?=
SSE=MSEn?2=
0.09294=0.305
置信区间为:
y?t?/2Sy(x0?x)21?nn?(xi?x)2i?1
=5.065±2.228×0.305× =5.065±0.318亿元 预测区间为:
21(16?11.711) ?12135.21863y?t?/2Sy?(x0?x)211??nn?(xi?x)2i?1
=5.065±2.228×0.305× =5.065±0.750亿元
21(16?11.711) 1??12135.21863第12章 多元线性回归
一、单选:1.D 2.B 3.C 4.B 5.C 6.C 7.D 8.C 9.C 10.D 11.C 12.A 13.D
二、多选:1.ABC 2.ABCD 3.BCD 4.ACDE 5.BCD 6.BC 7.AD 三、简答:
1.答:(1)随机误差项的期望为零,即
E(ut)?0。(2)不同的随机误差项之间相互独立,即
t无关,为一个常数,即
cov(ut,us)?E[(ut?E(ut))(us?E(us)]?E(utus)?0。(3)随机误差项的方差与
非随机变量,这个假设自动成立。(5)随机误差项ut为服从正态分布的随机变量,即ut存在多重共线性,即假定各解释变量之间不存在线性关系,即不存在多重共线性。
2var(ut)??2。即同方差假设。(4)随机误差项与解释变量不相关,即cov(xjt,ut)?0??(j?1,2,...,k)。通常假定xjt为
:N(0,?2)。(6)解释变量之间不
2. 答:因为人们发现随着模型中解释变量的增多,多重决定系数R的值往往会变大,从而增加了模型的解释功能。这样就使得人们认为要使模型拟合得好,就必须增加解释变量。但是,在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而损失自由度,而实际中如果引入的解释变量并非必要的话可能会产生很多问题,比如,降低预测精确度、引起.