=0.25×0.04+0.30×0.05+0.45×0.03=0.0385
0.45?0.030.0135==0.3506
0.25?0.04+0.30?0.05+0.45?0.030.03858.某人在每天上班途中要经过3个设有红绿灯的十字路口。设每个路口遇到红灯的事件是相
(2)P(A3|B)=互独立的,且红灯持续24秒而绿灯持续36秒。试求他途中遇到红灯的次数的概率分布及其期望值和方差、标准差。
解:据题意,在每个路口遇到红灯的概率是p=24/(24+36)=0.4。
设途中遇到红灯的次数=X,因此,X~B(3,0.4)。其概率分布如下表:
xi P(X= xi) 0 0.216 1 0.432 2 0.288 3 0.064 期望值(均值)=1.2(次),方差=0.72,标准差=0.8485(次) 9. 一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用):
(1)至少获利50万元的概率; (2)亏本的概率;
(3)支付保险金额的均值和标准差。
解:设被保险人死亡数=X,X~B(20000,0.0005)。
(1)收入=20000×50(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X ≤10)=0.58304。 (2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为: P(X>20)=1-P(X≤20)=1-0.99842=0.00158 (3)支付保险金额的均值=50000×E(X) =50000×20000×0.0005(元)=50(万元) 支付保险金额的标准差=50000×σ(X)
=50000×(20000×0.0005×0.9995)1/2=158074(元) 10.对上述练习题3.09的资料,试问:
(1)可否利用泊松分布来近似计算? (2)可否利用正态分布来近似计算?
(3)假如投保人只有5000人,可利用哪种分布来近似计算?
解: (1)可以。当n很大而p很小时,二项分布可以利用泊松分布来近似计算。本例中,λ= np=20000×0.0005=10,即有X~P(10)。计算结果与二项分布所得结果几乎完全一致。 (2)也可以。尽管p很小,但由于n非常大,np和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。
本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995, 即有X ~N(10,9.995)。相应的概率为: P(X ≤10.5)=0.51995,P(X≤20.5)=0.853262。
可见误差比较大(这是由于P太小,二项分布偏斜太严重)。
【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。
(3)由于p=0.0005,假如n=5000,则np=2.5<5,二项分布呈明显的偏态,用正态分
16
布来计算就会出现非常大的误差。此时宜用泊松分布去近似。
11.某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。若规定寿命低于150小时为不合格品。试求该企业生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9。 解:(1)P(X?150)?P(Z?150?200)=P(Z??1.6667)=0.04779 30合格率为1-0.04779=0.95221或95.221%。
(2) 设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有:
P(|X?200|?K)?P{|Z|=即:P{Z?|X?200|K?}?0.9
3030K}?0.95,K/30≥1.64485,故K≥49.3456。 3012.某商场某销售区域有6种商品。假如每1小时内每种商品需要12分钟时间的咨询服务,而且每种商品是否需要咨询服务是相互独立的。求:(1)在同一时刻需用咨询的商品种数的最可能值是多少?(2)若该销售区域仅配有2名服务员,则因服务员不足而不能提供咨询服务的概率是多少?
解:设X =同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2)
(1)X的最可能值为:X0=[(n+1)p]=[7×0.2]=1 (取整数) (2)P(X?2)?1?P(X?2)?1?=1-0.9011=0.0989
2k?0?C6k0.2k0.86?k
第4章 抽样与抽样分布——练习题(全免)
1. 一个具有n?64个观察值的随机样本抽自于均值等于20、标准差等于16的总体。
⑴ 给出x的抽样分布(重复抽样)的均值和标准差
⑵ 描述x的抽样分布的形状。你的回答依赖于样本容量吗? ⑶ 计算标准正态z统计量对应于x?15.5的值。 ⑷ 计算标准正态z统计量对应于x?23的值。 解: 已知 n=64,为大样本,μ=20,σ=16,
⑴在重复抽样情况下,x的抽样分布的均值为
a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。
⑴x<16; ⑵x>23; ⑶x>25; ⑷.x落在16和22之间; ⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013
3. 一个具有n?100个观察值的随机样本选自于??30、??16的总体。试求下列概率的近似值:
解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699
17
4. 一个具有n?900个观察值的随机样本选自于??100和??10的总体。
⑴ 你预计x的最大值和最小值是什么? ⑵ 你认为x至多偏离?多么远?
⑶ 为了回答b你必须要知道?吗?请解释。
解:a. 101, 99 b. 1 c. 不必
5. 考虑一个包含x的值等于0,1,2,…,97,98,99的总体。假设x的取值的可能性是相同的。则运用计算机对下面的每一个n值产生500个随机样本,并对于每一个样本计算x。对于每一个样本容量,构造x的500个值的相对频率直方图。当n值增加时在直方图上会发生什么变化?存在什么相似性?这里n?2,n?5,n?10,n?30和n?50。
解:趋向正态
6. 美国汽车联合会(AAA)是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、
金融、保险以及与汽车相关的各项服务。1999年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。
⑴ 描述x(样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x服从怎样
的分布以及x的均值和方差是什么?证明你的回答;
⑵ 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率
呢?在209美元和217美元之间的概率呢?
解: a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938
7. 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为??406克、标准差
为??10.1克。监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。现考虑这36袋奶粉所组成样本的平均重量x。
(1)描述x的抽样分布,并给出?x和?x的值,以及概率分布的形状;
(3) 假设某一天技术人员观察到x?400.8,这是否意味着装袋过程出
现问题了呢,为什么?
解: a. 406, 1.68, 正态分布 b. 0.001 c. 是,因为小概率出现了
8. 在本章的统计实践中,某投资者考虑将1000美元投资于n?5种不同的股票。每一种股
票月收益率的均值为??10%,标准差??4%。对于这五种股票的投资组合,投资
者每月的收益率是r??ri52。投资者的每月收益率的方差是?r??2n?3.2,它是
投资者所面临风险的一个度量。
⑴ 假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的
风险将会增加还是减少?请解释;
⑵ 假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,
并与只投资5种股票的情形进行比较。
解:a. 增加 b. 减少
9. 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以
牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE)希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算x,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。 ⑴ 如果该生产过程仍旧正常,则x的样本分布为何?
⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,
18
样本均值x≤830牛顿的概率是多少?
⑶ 在检验人员假定生产过程的标准差固定不变时,你对b部分有关当前生产过程的现
状有何看法(即夹克级别均值是否仍为840牛顿)?
⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛
顿。在这种情况下x的抽样分布是什么?当x具有这种分布时,则x≤830牛顿的概率是多少?
解: a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.06
10. 在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类:
由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。
一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De Vor, Chang,和Sutherland,1992)。
通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选n?5块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值x描绘在下图中。假设这个过程是在统计控制中的,则x的分布将具有过程的均值?,标准差具有过程
的标准差除以样本容量的平方根,?x??n。下面的控制图中水平线表示过程均值,
两条线称为控制极限度,位于?的上下3?x的位置。假如x落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。
当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从??2%和
??1%的近似的正态分布。
⑴ 假设n?4,则上下控制极限应距离?多么远?
⑵ 假如这个过程是在控制中,则x落在控制极限之外的概率是多少?
⑶ 假设抽取样本之前,过程均值移动到??3%,则由样本得出这个过程失控的(正
确的)结论的概率是多少?
解:a. 0.015 b. 0.0026 c. 0.1587
4.11. 参考练习4.10。肥皂公司决定设置比练习4.10中所述的3?x这一限度更为严格的控制
极限。特别地,当加工过程在控制中时,公司愿意接受x落在控制极限外面的概率是
0.10。
⑴ 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的
样本中使用n?4个观察值,则控制极限应该设定在哪里? ⑵ 假设a部分中的控制极限已付诸实施,但是公司不知道,(而不是2%)。?现在是3%若n?4,则x落在控制极限外面的概率是多少?若n?9呢? 解: a. (0.012, 0.028) b. 0.6553, 0.7278
4.12. 参考练习4.11。为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。
19
警戒限一般被设定为??1.96?x。假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的(蒙哥马利,1991年)。
⑴ 假设肥皂加工过程是在控制中(即,它遵循??2%和??1%的正态分布),则x的下一个值落在警戒限之外的概率是什么?
⑵ 假设肥皂加工过程是在控制中,则你预料到画在控制图上的x的这40个值中有多
少个点落在上控制极限以上? ⑶ 假设肥皂加工过程是在控制中,则x的两个未来数值落在下警戒线以下的概率是多
少?
解: a. 0.05 b. 1 c. 0.000625
第5章 参数估计
●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。
(1) 样本均值的抽样标准差σx等于多少?
(2) 在95%的置信水平下,允许误差是多少?
解:已知总体标准差σ=5,样本容量n=40,为大样本,样本均值x=25, (1)样本均值的抽样标准差σx=σ5==0.7906 n40(2)已知置信水平1-α=95%,得 Zα/2=1.96,
于是,允许误差是E =Zα/2σ=1.96×0.7906=1.5496。 n●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差;
(5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 σx=σ15==2.1429 n49(2)已知置信水平1-α=95%,得 Zα/2=1.96,
于是,允许误差是E =Zα/2σ=1.96×2.1429=4.2000。 n(3)已知样本均值为x=120元,置信水平1-α=95%,得 Zα/2=1.96, 这时总体均值的置信区间为 x?Zα/2124.2σ=120±4.2=
115.8n可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。
20