统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平) 下载本文

●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):

3.3

3.1

6.2

5.8

2.3

4.1

5.4

4.5

3.2

4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3

2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。 解:⑴计算样本均值x:将上表数据复制到Excel表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x=3.316667,

⑵计算样本方差s:删除Excel表中的平均值,点击自动求值→其它函数→STDEV→选定计算数据列→确定→确定,得到s=1.6093

也可以利用Excel进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=(a7-3.316667)^2”,回车,即得到各数据的离差平方,在最下行求总和,得到:

(x?i-)x=90.65

2再对总和除以n-1=35后,求平方根,即为样本方差的值

s=(x?i-x)2n?1=90.6535=1.6093。

⑶计算样本均值的抽样标准误差: 已知样本容量 n=36,为大样本, 得样本均值的抽样标准误差为 σx=sn=1.609336=0.2682

⑷分别按三个置信水平计算总体均值的置信区间:

① 置信水平为90%时:

由双侧正态分布的置信水平1-α=90%,通过2β-1=0.9换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 Zα 计算得此时总体均值的置信区间为

x?Zαs/2/2=1.64,

=3.3167±1.64×0.2682=

3.75652.8769n

可知,当置信水平为90%时,该校大学生平均上网时间的置信区间为(2.87,3.76)小时;

② 置信水平为95%时:

由双侧正态分布的置信水平1-α=95%,得 Zα 计算得此时总体均值的置信区间为

x?Zαs/2/2=1.96,

=3.3167±1.96×0.2682=

3.84232.7910n

21

可知,当置信水平为95%时,该校大学生平均上网时间的置信区间为(2.79,3.84)小时;

③ 置信水平为99%时:

若双侧正态分布的置信水平1-α=99%,通过2β-1=0.99换算为单侧正态分布的置信水平β=0.995,查单侧正态分布表得 Zα 计算得此时总体均值的置信区间为

x?Zαs/2/2=2.58,

=3.3167±2.58×0.2682=

4.00872.6247

n 可知,当置信水平为99%时,该校大学生平均上网时间的置信区间为(2.62,4.01)小时。

4. 从一个正态总体中随机抽取容量为8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。 解:(7.1,12.9)。

5.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(公里)分别是:

10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 求职工上班从家里到单位平均距离95%的置信区间。 解:(7.18,11.57)。

●6. 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比率的置信区间,置信水平分别为90%和95%。

解:已知样本容量n =200,为大样本,拥有该品牌电视机的家庭比率p =23%,

拥有该品牌电视机的家庭比率的抽样标准误差为

σp=

p(1?p)n=0.23?0.77200=2.98% ⑴双侧置信水平为90%时,通过2β-1=0.90换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 Zα=1.64,

p(1?p)/2/2 此时的置信区间为 p?Zαn=23%±1.64×2.98%=

27.89.11%

可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为

(18.11%,27.89%)。

⑵双侧置信水平为95%时,得 Zα 此时的置信区间为 p?Zα/2=1.96,

28.8408.1592%p(1?p)/2n=23%±1.96×2.98%=

可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为

;(17.16%,28.84%)。

22

●7.某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 (1)求总体中赞成该项改革的户数比率的置信区间,置信水平为95%;

(2)如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查? 解: 已知总体单位数N=500,重复抽样,样本容量n =50,为大样本,

样本中,赞成的人数为n1=32,得到赞成的比率为 p =

p(1?p)nn1n=

3250=64%

(1)赞成比率的抽样标准误差为 =0.64?0.3650/2=6.788%

由双侧正态分布的置信水平1-α=95%,得 Zα=1.96,

计算得此时总体户数中赞成该项改革的户数比率的置信区间为 p?Zα77.304%p(1?p)= 64%±1.96×6.788%=

50.696%n/2可知,置信水平为95%时,总体中赞成该项改革的户数比率的置信区间为

(50.70%,77.30%)。

(2)如预计赞成的比率能达到80%,即 p=80%, 由

p(1?p)=6.788%,即n0.8?0.2n=6.788% 得样本容量为 n =

0.8?0.2(6.788%)2= 34.72 取整为35,

即可得,如果小区管理者预计赞成的比率能达到80%,应抽取35户进行调查。

8.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:

来自总体1的样本

n1?14 x1?53.2

s1?96.8

2来自总体2的样本

n2?7 x2?43.4

s2?102.0

2(1) 求?1??290%的置信区间;

(2) 求?1??295%的置信区间。 解:(1.86,17.74);(0.19,19.41)。

9.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:

来自总体1的样本 来自总体2的样本

x1?25

s1?16

2x2?23

s2?20

2(1)设n1?n2?100,求?1??295%的置信区间;

23

(2)设n1?n2?10,?1??2,求?1??295%的置信区间; (3)设n1?n2?10,?1??2,求?1??295%的置信区间; (4)设n1?10,n2?20,?1??2,求?1??295%的置信区间;

(5)设n1?10,n2?20,?1??2,求?1??295%的置信区间。 解:(1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。 10.下表是由4对观察值组成的随机样本:

配对号 来自总体A的样本 来自总体B的样本

1 2 3 4

2 5 10 8

0 7 6 5

22222222(1)计算A与B各对观察值之差,再利用得出的差值计算d和sd;

(2)设?1和?2分别为总体A和总体B的均值,构造?d(?1??2)95%的置信区间。 解:(1)d?1.75,sd?2.63;(2)1.75±4.27。

11.从两个总体中各抽取一个n1?n2?250的独立随机样本,来自总体1的样本比率为p1?40%,来自总体2的样本比率为p2?30%。

(1)构造?1??290%的置信区间;

(2)构造?1??295%的置信区间。 解:(1)10%±6.98%;(2)10%±8.32%。

12.生产工序的方差是共需质量的一个重要度量。当方差较大时,需要对共需进行改进以减小方差。下面是两部机器生产的袋茶重量(克)的数据: 机器1 3.45 3.20 3.22 3.50 2.95 3.16 3.20 3.22 2.98 3.75 3.38 3.45 3.48 3.18 2机器2 3.90 3.70 3.28 3.35 3.20 3.12 3.25 223.22 3.38 3.30 3.30 3.34 3.28 3.30 3.28 3.19 3.20 3.29 3.35 3.16 3.34 3.35 3.30 3.05 3.33 3.27 3.28 3.25 构造两个总体方差比?1?95%的置信区间。

解:(4.06,14.35)。

●13.根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?

解:已知总体比率?=2%=0.02,由置信水平1-α=95%,得置信度Zα/2=1.96,允许误差E≤ 4%

即由允许误差公式 E=Zα/2σpn整理得到样本容量n的计算公式:

24

n=(Zα/2σPE)=(2Zα/2π(1-π)E)=

2Z2α/2π(1-π)2E≥

1.96?0.02?0.980.0422=47.0596

由于计算结果大于47,故为保证使“≥”成立,至少应取48个单位的样本。

●14.某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求允许误差不超过20元,应抽取多少个顾客作为样本?

解:已知总体标准差?x=120,由置信水平1-α=95%,得置信度Zα/2=1.96,允许误差E≤ 20

即由允许误差公式 E=Zα/2Zα/2σxEσxn整理得到样本容量n的计算公式:

n=()≥(21.96?12020)=138.2976

2由于计算结果大于47,故为保证使“≥”成立,至少应取139个顾客作为样本。 15.假定两个总体的标准差分别为:?1?12,?2?15,若要求误差范围不超过5,相应的置信水平为95%,假定n1?n2,估计两个总体均值之差?1??2时所需的样本容量为多大? 解: 57。

16.假定n1?n2,允许误差E?0.05,相应的置信水平为95%,估计两个总体比率之差

?1??2时所需的样本容量为多大?

解: 769。

第6章 假设检验——练习题(全免)

6.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,

所以原假设与备择假设应为:H0:??1035,H1:??1035。

H0:??0.04,6.2 ?=“某一品种的小鸡因为同类相残而导致的死亡率”, H1:??0.04。

6.3 H0:??65,H1:??65。

6.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但

检验结果却提供证据支持店方倾向于认为其重量少于60克;

(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验

结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品; (3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。 6.5 (1)检验统计量z?x??s/n,在大样本情形下近似服从标准正态分布;

(2)如果z?z0.05,就拒绝H0;

(3)检验统计量z=2.94>1.645,所以应该拒绝H0。

25