应用统计学课后习题与参考答案 下载本文

第四章 一、选择题

1.1990年发表的一篇文章讨论了男性和女性工商管理硕士(MBA)毕业生起薪的差别。文章称,从前20名商学院毕业的女性工商管理硕士(MBA)的平均起薪是54 749美元,中位数是47 543美元,标准差是10 250美元。对样本均值可解释为(C)。

A.大多数女性工商管理硕士(MBA)的起薪是54 749美元 B.最常见到的起薪是54 749美元 C.样本起薪的平均值为54 749美元 D.有一半的起薪低于54 749美元 2.同上题,对样本标准差可解释为(D)。 A.最高起薪与最低起薪之差是10 250美元

B.大多数的起薪在44 499美元和64 999美元之间 C.大多数的起薪在37 293美元和57 793美元之间 D.大多数的起薪在23 999美元和85 499美元之间

3.同上题,根据这些数据可以判断,女性工商管理硕士(MBA)起薪的分布形状是(B)。 A.尖峰,对称 B.右偏 C.左偏 D.均匀

4.美国10家公司在电视广告商的花费如下(百万美元):72,63.1,54.7,54.3,29,26.9,25,23.9,23,20,那么,样本方差为(B)。

A.19.543 3 B.381.939 C.18.540 4 D.343.745 5.美国10家公司在电视广告上的花费如下(百万美元):72,63.1,54.7,54.3,29,26.9,25,23.9,23,20,那么,样本数据的中位数为(C)。

A.28.46 B.30.20 C.27.95 D.28.12

6.对于右偏分布,均值、中位数和众数之间的关系是(A)。

A.均值>中位数>众数 B.中位数>均值>众数 C.众数>中位数>均值 D.众数>均值>中位数

7.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的离散程度的测度指标是(B)。

A.方差 B.极差

C.标准差 D.变异系数 8.五所大学新生的教科书费用如下(元):200,250,375,125,280。教科书费用的方差是(B)。

A.92.965 B.8 642.5 C.83.150 5 D.6 914.0

9.五种新型车的最高时速如下:100,125,115,175,120。它们的标准差为(A)。 A.28.416 5 B.807.5 C.25.416 5 D.646.0

10.大学生每学期花在教科书上的费用平均为280元,标准差为40元。如果已知学生在教科书上的花费是尖峰对称分布,则在教科书上的花费在160元和320元之间的学生占(D)。

A.大约95% B.大约97.35% C.大约81.5% D.大约84%

11.某班学生的平均成绩是180分,标准差是50分。如果没有成绩分布的其他信息,可以判断成绩在80到280分的学生占(A)。

A.大约95% B.至少89% C.大约68% D.至少75%

12.当某一分布为左偏分布时,测度集中趋势的三个统计量众数M0,中位数Me和平均数x的关系为(D)。

A.M0<Me<x B.Me<M0<x C.x<M0<Me D.x<Me<M0

13.(B)是测度离散趋势的测度值。

A.平均数 B.方差 C.中位数 D.峰度 14.下列有关样本方差的公式,描述正确的是(C)。

(xi?x)2(xi?E(x))222A.s? B.s?

n?1n?1(xi?x)2(xi?x)2??22C.s? D.s?

n?1n15.下列指标中,易受极端值影响的指标为(B)。

A.众数 B.平均数 C.四分位数 D.中位数 16.下列有关变异系数的定义正确的是(C )。

s2s2A. B.

nxsxC. D.

xs二、简答题

1.什么是数据的集中趋势,度量数据集中趋势的指标有哪些?

答题要点:

数据的集中趋势是度量一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。集中趋势测度也就是寻找数据水平的代表值或中心值。测度数据集中趋势的统计量主要包括平均数、众数、中位数和分位数。

2.什么是数据的离散程度,度量数据离散程度的指标有哪些?

答题要点:

数据的离散程度是反映各变量值远离其中心值的程度,因此也称为离中趋势。 度量数据离散程度的指标主要有平均差、方差和标准差、极差、平均差以及变异系数等。 3.试回答在不同分布类型中(对称、左偏和右偏),比较平均数、众数和中位数之间的关系。

(1)如果数据的分布是对称的,那么众数(M0)、中位数(Me)和平均数(x)必定相等,即M0?Me?x;

(2)如果数据是左偏分布,那就说明数据存在极小值,必然拉动平均数向极小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为;x?Me?M0;

(3)如果数据是右偏分布,那就说明数据存在极大值,必然拉动平均数向极大值一方靠,即M0?Me?x。

第五章

一、选择题

1.已知总体的均值为100,标准差为10,从该总体中随机抽取容量为100的样本,则样本均值抽样分布的标准误差为(C)。

A.100 B.10 C.1 D.50

2.抽样平均误差,确切地说是所有样本指标(样本平均数和样本成数)的(C)。

A.平均数 B.全距 C.标准差 D.离差系数

3.在不重置抽样中,抽样单位数从5%增加到20%,抽样平均误差(C)。

A.增加39.7% B.增加约一半 C.减少约一半 D.没有什么变化

4.在其他条件不变的情况下,如果允许误差范围缩小为原来的1/2,则样本容量(A)。

A.扩大为原来的4倍 B.扩大为原来的2倍 C.缩小为原来的1/2倍 D.缩小为原来的1/4倍 5.社会经济现象多呈(甲、对称分布;乙、U型分布;丙、“两头小,中间大”分布;丁、“两头大,中间小”分布)(C)分布。

A.甲、丙 B.甲、丁 C.乙、丙 D.乙、丁 6.随机抽出100个工人,占全体工人1%,工龄不到一年的比重为10%。在概率为0.954 5(t=2)时,计算工龄不到一年的工人比重的抽样极限误差(B)。

A.0.6% B.6% C.0.9% D.3% 二、简答题(略)

1.如何理解总体参数与样本统计量的含义? 2.请举例说明几种常用的抽样方法。

3.什么是抽样分布?请列举几种常见的抽样分布。 4.样本均值的分布与总体分布的关系是什么? 5.解释中心极限定量的含义。 三、计算题

1.从均值为200、标准差为50的总体中,抽取n=100的简单随机样本,用样本均值x估计总体均值。

(1)x的数学期望是多少? 200

(2)x的标准差是多少? 5

(3)x的抽样分布是什么? 正态分布

2

(4)样本方差S的抽样分布是什么?

?2(100?1)。

2.假定总体共有1 000个单位,均值?=32,标准差??5。从中抽取一个样本量为30的简单随机样本用于获得总体信息。

(1)x的数学期望是多少? 32

(2)x的标准差是多少? 0.91。

3.从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。样本均值的抽样标准差?x等于多少?

0.79

4.设总体均值??17,标准差??10。从该总体中抽取一个样本量为25的随机样本,其均值为x25;同样,抽取一个样本量为100的随机样本,样本均值为x100。 (1)描述x25的抽样分布。 x25N(17,22)

(2)描述x100的抽样分布。 x100N(17,1)

5.从??10的总体中抽取样本量为50的随机样本,求样本均值的抽样标准差: (1)重复抽样。 1.41

(2)不重复抽样,总体单位数分别为50 000、5 000、500。 1.41,1.41,1.34

6.假定顾客在超市一次性购物的平均消费是85元,标准差是9元。从中随机抽取40个顾客,每个顾客消费金额大于87元的概率是多少?

?x??? P?X?87??1?P(X?87)?1?????40???1?0.92073?0.07927??7.在校大学生每月的平均支出是448元,标准差是21元。随机抽取49名学生,样本

均值在441~446之间的概率是多少?

?446?448??441?448??2??7?P?441?X?446????????????????????0.2415?2149??2149?3???3?????

第六章 分析计算题

1.某加油站64位顾客所组成的样本资料显示,平均加油量是13.6加仑。若总体标准差是3.0加仑,则每个人平均加油量95.45%置信区间估计值是多少?

答题要点:

已知样本容量n?64,样本均值x?13.6,总体标准差??3,置信水平1???95.45 查表得z?/2?2,于是总体平均加油量95.45%的置信区间为:

?3x?z?2?13.6?2??13.6?0.75

n642.在由一所大学的90名学生所组成的样本显示,有27名学生会以及格与不及格作为选课的依据。

(1)以及格与不及格作为选课依据的同学占全体同学比率的点估计为多少?

(2)以及格与不及格作为选课依据的同学占全体同学比率的90%置信区间估计值为多少?

答题要点:

已知样本容量n?90,样本比例p?30%,置信水平1???90%

(1)可见,以及格与不及格作为选课依据的同学占全体同学比率的点估计为p?30%。 (2)查表得z?/2?1.64,于是总体平均加油量90%的置信区间为:

p(1?p)0.3?0.7?0.3?1.64?0.3?0.08 n903.在500个抽样产品中,有95%的一级品。试测定抽样平均误差,并用95.45%的概率估计全部产品非一级品概率的范围。

p?z?/2答题要点:

已知样本容量n?500,样本比例p?1?95%?5%,1???95.45% 查表知,查表得z?/2?2,于是全部产品非一级品率95.45%的置信区间为:

p(1?p)0.05?0.95?0.05?2?0.05?0.02 n5004.从某农场种植的水稻中随机抽取200亩进行产量调查,测得平均亩产量为380kg,亩产量的标准差为25 kg,要求:

(1)计算平均亩产量的平均抽样误差;

(2)试以99%的置信概率推断全场水稻总产量的所在范围;

(3)如果要求抽样极限误差不超过5 kg,亩产量的标准差仍为25 kg,则概率为0.99时,应抽取多少亩进行调查?

p?z?/2答题要点:

已知样本容量n?200,样本均值x?380,样本标准差s?25 (1)平均亩产量的平均抽样误差为:

?x?s25??1.77 n200(2)查表得z?/2?2.58,于是全场水稻总产量的99%的置信区间为: s25x?z?/2?380?2.58??380?4.56

n200(3)必要的样本容量为: