《抽样技术》习题答案

第2章

2.2解: 项目 相同之处 不同之处 定义 都是根据从一个总体中抽样得到的样本,然后定义样本均值为1ny??yi。 ni?1_抽样理论中样本是从有限总体中按放回的抽样方法得到的,样本中的样本点不会重复;而数理统计中的样本是从无限总体中利用有放回的抽样方法得到的,样本点有可能是重复的。 性质 (1) 样本均值的期望都等于总体均值,也就是抽样理论和数理统计中的样本均值都是无偏估计。 (2) 不论总体原来是何种分布,在样本量足够大的条件下,样本均值近似服从正态分布。 (1) 抽样理论中,各个样本之间是不独立的;而数理统计中的各个样本之间是相互独立的。 (2) 抽样理论中的样本均值的方差为_1?f21??2V?y??S,其中S?Yi?Y?。??nN?1??2在数理统计中,V?y??方差。 12?,其中?2为总体的n

2.3 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大

样本的条件下,间为?y?z?y?YV?y?_?y?E?y?V?y?近似服从标准正态分布, Y的1???95%的置信区

_V?y?,y?z?2V?y????y?1.96V?y?,y?1.96V?y??。

????1?f2S中总体的方差S2是未知的,用样本方差s2来代替,置信区间而V?y??n2?1?f1?fs,y?1.96为?y?1.96nn?_?s? ?2由题意知道,y?9.5,s?206,而且样本量为n?300,N?50000,代入可以求得

v(y)?_1?f21?30050000s??206?0.6825。将它们代入上面的式子可得该市居民n300日用电量的95%置信区间为??7.8808,11.1192??。

下一步计算样本量。绝对误差限d和相对误差限r的关系为d?rY。

_ 1

根据置信区间的求解方法可知

?__y?Y?_?__??P?y?Y?rY??1???P?????V?y????rY????1??

V?y????_?__?2_y?Y????rY????Z?2??1??,所以V?y???根据正态分布的分位数可以知道P?。

?z?2??V?y?????????_?rY??11?也就是???S2???n?1??nNz????2?_22??_????rY??1?????。

22?Nz??/2S????2把y?9.5,s?206,r?10%,N?50000代入上式可得,n?861.75?862。所以样

本量至少为862。

2.4 解:总体中参加培训班的比例为P,那么这次简单随机抽样得到的P的估计值p的方差V?p??p?P1?fNP?1?P?,利用中心极限定理可得在大样本的条件下近

nN?1V?p?似服从标准正态分布。在本题中,样本量足够大,从而可得P的1???95%的置信区间为

?p?z?2V?p?,p?z?2V?p??。

??而这里的V?p?是未知的,我们使用它的估计值

V?p??v?p???^1?fp?1?p??9.652?10?5。所以总体比例P的1???95%的置信区间n?12可以写为?p?z?v?p?,p?z?2v?p??,将p?0.35,n?200,N?10000代入可得置

?信区间为??0.2844,0.4156??。

2.5 解:利用得到的样本,计算得到样本均值为y?2890/20?144.5,从而估计小

区的平均文化支出为144.5元。总体均值Y的1???95%的置信区间为

_?y?z?2V?y?,y?z?2V?y??,用v?y??1?fs2来估计样本均值的方差V?y?。 ??n1?f21?0.12s??826.0?256,37.17225则6v?y??计算得到s?826.0,

n20

2

z?2V?y??1.96?37.172?11.95,代入数值后计算可得总体均值的95%的置信区间为

?132.55,156.45?。

2.6 解:根据样本信息估计可得每个乡的平均产量为1 120吨,该地区今年的粮食总产

量Y的估计值为Y?350y?350?1120?3.92?105(吨)。

^N2?1?f?2??总体总值估计值的方差为V?Y??总体总值的1???95%的置信区间S,

n??^?^?^?^?^??为?Y?z?2V?Y?,Y?z?2V?Y??,把Y?3.92?105,S2?25600,n?50,N?350,

????????^_f?n,z?2?1.96代入,可得粮食总产量的1???95%的置信区间为N??377629,406371??。

2.7 解:首先计算简单随机抽样条件下所需要的样本量,把

?1d2?N?1000,d?2,1???95%,S?68带入公式n0?1??22?,最后可得

?Nz?/2S?2n0?61.3?62。

如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为

n?n070%?88.57?89。

2.8 解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关

系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为X?2135。利用去年的化肥总产量,今年的化

^^肥总产量的估计值为YR?RX?yx__X?2426.14吨。

1?f2s=37.17。 n2.9 解:本题中,简单估计量的方差的估计值为v?y??利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为X。文化支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。

文化支出的比率估计量为yR?RX?_^_yx__X,通过计算得到y?2890/20?144.5,而

___144.5x?1580,则R?_??0.09151580x_^y_,文化支出的比率估计量的值为yR?146.3(元)。

3

现在考虑比率估计量的方差,在样本量较大的条件下,

V?yR??MSE?yR??22x1?f2S?2R?S?Sx?R2Sx2?,通过计算可以得到两个变量的样?n4^本方差为s?826,s?9.958?10,Y和X之间的相关系数的估计值为??0.974,

?_?代入上面的公式,可以得到比率估计量的方差的估计值为v?yR??1.94。这个数值

??比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的1???95%的置信区间为?yR?z??2v?yR?,yR?z?2v?yR????yR?1.96v?yR?,yR?1.96v?yR??,

???把具体的数值代入可得置信区间为?143.57,149.03?。

?_??_?V?yR?v?yR???????1.94?0.052,这是比估

接下来比较比估计和简单估计的效率,

V?y?v?y?37.17计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。

22.10 解:利用简单估计量可得y??yin?1630/10?163,样本方差为s?212.222,

N?120,样本均值的方差估计值为v?y??1?f21?10/120s??212.222?19.4537。 n10利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是

合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为??0.971,而且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原重量为辅助变量。

回归估计量的精度最高的回归系数?的估计值为???^^^s14.568?0.971??1.368。sx10.341?__?现在可以得到肉牛现重量的回归估计量为ylr?y???X?x?,代入数值可以得到

??^_ylr?159.44。

_?_??_?1?f2回归估计量ylr的方差为V?ylr??MSE?ylr??S?1??2?,方差的估计值为

n????_^2??_?1?f2?v?ylr??s?1???,代入相应的数值,

n????2?_?1?f2?^?v?ylr??s?1????1.112,显然

n?????_?有v?ylr??v?y?。在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量

??

4

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4