统计学答案

统计学课本课后作业题(全) 题目:

第1章:P11 6,7

第2章:P52 练习题3、9、10、11

第3章: P116 思考题12、14 练习题16、25 第4章:P114 思考题6,练习题2、4、6、13 第5章:P179 思考题4、练习题3、4、6、11 第6章: P209 思考题4、练习题1、3、6 第7章: P246 思考题1、练习题1、7 第8章: P287 思考题4、10 练习题2、3

第一章

6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;最近的一个集装箱内的全部油漆;

(2)描述研究变量;装满的油漆罐的质量; (3)描述样本;最近的一个集装箱内的50罐油漆; (4)描述推断。50罐油漆的质量应为×50=226.8 kg。

7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:

答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。

第二章

3.某百货公司连续40天的商品销售额如下(单位:万元):

41 25 29 47 38 34 30 38

46 35 42

36 28 36

45 46 37

37 34 37

37 30 49

36 37 39

45 44 42

43 26 32

43 33 38 36

40 44 44 35

根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。

解:采用等距分组 全距=49-25=24

n=40 取组距为5,则组数为 24/5= 取5组 频数分布表: 按销售额分组(万元) 25-30 30-35 35-40 40-45 45-50 频数(天数) 4 6 15 9 6 合计 40 9.某百货公司6月份各天的销售额数据如下(单位:万元): 257 271 272

276 292 284

297 261 268

252 281 303

238 301 273

310 274 263

240 267 322

236 280 249

265 291 269

278 258 295

(1)计算该百货公司日销售额的均值、中位数和四分位数;

(2)计算日销售额的标准差。 解:(1)

x=

?x=8223=(万元)

n30将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:Me=

272?273=(万元) 2273?272=(万元) 4由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的第8位是261,第15位是272,从而:QL=261+

同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后第23位是291,第16位是273,从而:QU=291-

273?272=(万元)。 4?(x?x)i302(2)未分组数据的标准差计算公式为: s=

i?1n?1得s=。

10.甲乙两个企业生产三种产品的单位成本和总成本资料如下: 产品 名称 A B C 单位成本 (元) 15 20 30 总成本(元) 甲企业 2100 3000 1500 乙企业 3255 1500 1500 比较哪个企业的总平均成本高?并分析其原因。 xf?解:设产品单位成本为 x,产量为f,则总成本为xf,由于:平均成本x=

?f量f 的数据,又因个别产品产量f =

=

总成本,而已知数据中缺产

总产量该产品成本xf=从而 x=

该产品单位成本x?xfxf?x,于是得:甲企业平均成本=

?xfxf?x=

2100?3000?1500=(元),

210030001500??152030=

xf?乙企业平均成本=

xf?x3255?1500?1500=(元),对比可见,甲企业的总平均成本较高。原因:尽

325515001500??152030管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

11.在某地区抽取的120家企业按利润额进行分组,结果如下:

按利润额分组(万元)

200~300 300~400 400~500 500~600 600以上 合计

企业数(个)

19 30 42 18 11 120

计算120家企业利润额的均值和标准差。

解:设各组平均利润为 x,企业数为f,则组总利润为xf,

由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:

按利润额分组(万元)

200~300 300~400 400~500 500~600 600以上 合计

于是,120家企业平均利润为:x=

组中值 x 250 350 450 550 650 —

企业数(个)

f 19 30 42 18 11 120

总利润 xf 4750 10500 18900 9900 7150 51200

?xf?f=

51200= (万元); 120s =?(x?x)?f?1i2f=1614666.668=(万元)。

120?1第3章

思考练习:12解析总体分布、样本分布和抽样分布的含义 总体分布:就是与总体相联系的随机变量的概率分布 样本分布:是与样本相联系的随机向量的联合概率分布

抽样分布:就是作为样本的函数的统计量的分布

14解析中心极限定理的含义:是阐述大量随机变量之和的分布趋近于正态分布的一系列定理的总称。

16某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时若规定寿命低于150小时为不合格品。试求

(1) 该企业生产的电池的合格率是多少?

(2) 该企业生产的寿命在200小时左右的多大范围内的概率不小于? 解(1)P(X?150)?P(Z?合格率为=或%。

(2) 设所求值为K,满足电池寿命在200±K小时范围内的概率不小于,即有:

即:P{Z150?200)=P(Z??1.6667)=

30?K}?0.95,K/30≥,故K≥。 3025某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以牛顿为单位)来定级

的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算x,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。

⑴ 如果该生产过程仍旧正常,则x的样本分布为何?

⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,样本均值x≤830牛

顿的概率是多少?

⑶ 在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现状有何看法(即夹克

级别均值是否仍为840牛顿)?

⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛顿。在这种情况下x的抽样分布是什么?当x具有这种分布时,则x≤830牛顿的概率是多少?

第四章参数估计

6简述样本量与置信水平、总体方差、允许误差的关系。

样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比

2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求允许误差;

(3) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元则样本均值的抽样标准误差为 σx=(2)已知置信水平1-α=95%,得 Zα/2=,于是,允许误差是 E =Zα/2σ15== n49σ=×=。 n(3)已知样本均值为x=120元,置信水平1-α=95%,得 Zα/2=, 这时总体均值的置信区间为 x?Zα/2124.2σ=120±=

115.8n可知,如果样本均值为120元,总体均值95%的置信区间为(,)元。

4. 从一个正态总体中随机抽取容量为8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。

解:(,)。

6. 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比率的置信区间,置信水平分别为90%和95%。 解:已知样本容量n =200,为大样本,拥有该品牌电视机的家庭比率p =23%,

拥有该品牌电视机的家庭比率的抽样标准误差为

σp=p(1?p)0.23?0.77==% n200⑴双侧置信水平为90%时,通过2β-1=换算为单侧正态分布的置信水平β=,查单侧正态分布表得 Zα/2=,

此时的置信区间为 p?Zα/227.89%p(1?p)=23%±×%= n18.11%可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为(%,%)。 ⑵双侧置信水平为95%时,得 Zα/2=,

此时的置信区间为 p?Zα/228.8408%p(1?p)=23%±×%= n17.1592%可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为;(%,%)。

13.根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?

解:已知总体比率?=2%=,由置信水平1-α=95%,得置信度Zα/2=,允许误差E≤ 4%即由允许误差公式

E=Zα/2σpn整理得到样本容量n的计算公式:

Zα/2σP2Zα/2π(1-π)2Z2α/2π(1-π)1.962?0.02?0.98)=)=(n=(≥= 22EE0.04E由于计算结果大于47,故为保证使“≥”成立,至少应取48个单位的样本。

第五章

4什么是P值?P值检验决策的意义是什么?

答:p值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。P值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显着性水平?,来控制犯第一类错误的上限,p值可以有效地补充?提供地关于检验可靠性的有限信息。p值检验的优点在于,它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显着性。

3一家大型超市连锁店上个月接到许多消费者投诉某种品牌炸土豆片中60g一袋的那种土豆片的重量不符合。店方猜想引起这些投诉的原因是运输过程中沉积在食品袋底部的土豆片碎屑,但为了使顾客们对花钱买到的土豆片感到物有所值,店方仍然决定对来自于一家最大的供应商的下一批袋装炸土豆片的平均重量(g)u进行检验, 假设陈述如下:Ho:u>=60H1:u<60

(1)与这一假设检验问题相关联的第I类错误是什么? (2)与这一假设检验问题相关联的第II类错误是什么?

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4