如何使用excel计算概率论一些题目 下载本文

如何使用excel计算概率论一些题目

简单介绍一些

1.1.1 t分布

Excel计算t分布的值(查表值)采用TDIST函数,格式如下:

TDIST(变量,自由度,侧数)

其中:

变量(t):为判断分布的数值; 自由度(v):以整数表明的自由度;

侧数:指明分布为单侧或双侧:若为1,为单侧;若为2,为双侧.

范例:设T服从t(n-1)分布,样本数为25,求P(T>1.711). 已知t=1.711,n=25,采用单侧,则T分布的值:

=TDIST(1.711,24,1)

得到0.05,即P(T>1.711)=0.05. 若采用双侧,则T分布的值:

=TDIST(1.711,24,2) 得到0.1,即PT?1.711?0.1.

??1.1.2 t分布的反函数

Excel使用TINV函数得到t分布的反函数,格式如下:

TINV(双侧概率,自由度)

范例:已知随机变量服从t(10)分布,置信度为0.05,求t0.05(10).输入公式

2=TINV(0.05,10)

得到2.2281,即PT?2.2281?0.05.

若求临界值tα(n),则使用公式=TINV(2*α, n).

范例:已知随机变量服从t(10)分布,置信度为0.05,求t0.05 (10).输入公式

=TINV(0.1,10) 得到1.812462,即t0.05 (10)= 1.812462.

??

1.1.3

F分布

Excel采用FDIST函数计算F分布的上侧概率1?F(x),格式如下:

FDIST(变量,自由度1,自由度2)

其中:

变量(x):判断函数的变量值;

自由度1(n1):代表第1个样本的自由度; 自由度2(n2):代表第2个样本的自由度.

范例:设X服从自由度n1=5,n2=15的F分布,求P(X>2.9)的值.输入公式

=FDIST(2.9,5,15)

得到值为0.05,相当于临界值α.

1.1.4 F分布的反函数

Excel使用FINV函数得到F分布的反函数,即临界值F?(n1,n2),格式为: FINV(上侧概率,自由度1,自由度2)

范例:已知随机变量X服从F(9,9)分布,临界值α=0.05,求其上侧0.05分位点F0.05(9,9).输入公式

=FINV(0.05,9,9)

得到值为3.178897,即F0.05(9,9)= 3.178897. 若求单侧百分位点F0.025(9,9),F0.975(9,9).可使用公式

=FINV(0.025,9,9) =FINV(0.975,9,9)

得到两个临界值4.025992和0.248386.

若求临界值Fα(n1,n2),则使用公式=FINV(α, n1,n2).

1.1.5 卡方分布

Excel使用CHIDIST函数得到卡方分布的上侧概率1?F(x),其格式为:

CHIDIST(数值,自由度)

其中:

数值(x):要判断分布的数值; 自由度(v):指明自由度的数字.

范例:若X服从自由度v=12的卡方分布,求P(X>5.226)的值.输入公式

=CHIDIST(5.226,12) 得到0.95,即1?F(5.226)=0.95或F(5.226)=0.05.

1.1.6 卡方分布的反函数

2Excel使用CHIINV函数得到卡方分布的反函数,即临界值??(n).格式为:

CHIINV(上侧概率值α,自由度n) 范例:下面的公式计算卡方分布的反函数:

=CHIINV(0.95,12)

2得到值为5.226,即?0.95(12)=5.226.

2若求临界值χα(n),则使用公式=CHIINV(α, n).

1.1.7 泊松分布

计算泊松分布使用POISSON函数,格式如下:

POISSON(变量,参数,累计)

其中:变量:表示事件发生的次数; 参数:泊松分布的参数值;

累计:若TRUE,为泊松分布函数值;若FALSE,则为泊松分布概率分布值. 范例:设X服从参数为4的泊松分布,计算P{X=6}及P{X≤6}.输入公式

=POISSON(6,4,FALSE) =POISSON(6,4,TRUE)

得到概率0.104196和0.889326.

在下面的实验中,还将碰到一些其它函数,例如:计算样本容量的函数COUNT,开平方函数SQRT,和函数SUM,等等.关于这些函数的具体用法,可以查看Excel的关于函数的说明,不再赘述.

2 区间估计实验

计算置信区间的本质是输入两个公式,分别计算置信下限与置信上限.当熟悉了数据输入方法及常见统计函数后,变得十分简单.

2.1 单个正态总体均值与方差的区间估计:

?2已知时?的置信区间

2.1.1

置信区间为?x?u????n,x?u?2??2?. n? 例1 随机从一批苗木中抽取16株,测得其高度(单位:m)为:1.14 1.10 1.13 1.15 1.20 1.12 1.17 1.19 1.15 1.12 1.14 1.20 1.23 1.11 1.14 1.16.设苗高服从正态分布,求总体均值μ的0.95的置信区间.已知σ =0.01(米). 步骤:

(1)在一个矩形区域内输入观测数据,例如在矩形区域B3:G5内输入样本数据.

(2)计算置信下限和置信上限.可以在数据区域B3:G5以外的任意两个单元格内分别输入如下两个表达式:

=average(b3:g5)-normsinv(1-0.5*?)*?/sqrt(count(b3:g5)) =average(b3:g5)+normsinv(1-0.5*?)*?/sqrt(count(b3:g5)) 上述第一个表达式计算置信下限,第二个表达式计算置信上限.其中,显著性水平?和标准差?是具体的数值而不是符号.本例中,? =0.05, ??0.01,上述两个公式应实际输入为

=average(b3:g5)-normsinv(0.975)*0.01/sqrt(count(b3:g5)) =average(b3:g5)+normsinv(0.975)*0.01/sqrt(count(b3:g5))

计算结果为(1.148225, 1.158025).

2.1.2

?2未知时?的置信区间

置信区间为 ?x?t?(n?1)??2SS?,x?t?(n?1)?. nn?2 例2 同例1,但?未知.

输入公式为:

=average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5)) =average(b3:g5)-tinv(0.05,count(b:3:g5)-1)*stdev(b3:g5)/sqrt(count(b3:g5)) 计算结果为(1.133695, 1.172555).

2.1.3

?未知时?2的置信区间:

?2?(n?1)s 置信区间为 ?2,???(n?1)?2?(n?1)s??. 2?1??(n?1)?2?2 例3 从一批火箭推力装置中随机抽取10个进行试验,它们的燃烧时间

(单位:s)如下:

50.7 54.9 54.3 44.8 42.2 69.8 53.4 66.1 48.1 34.5 试求总体方差?2的0.9的置信区间(设总体为正态).

操作步骤:

(1)在单元格B3:C7分别输入样本数据;

(2)在单元格C9中输入样本数或输入公式=COUNT(B3:C7); (3)在单元格C10中输入置信水平0.1.

(4)计算样本方差:在单元格C11中输入公式=VAR(B3:C7)

(5)计算两个查表值:在单元格C12中输入公式=CHIINV(C10/2,C9-1),在单元格C13中输入公式=CHIINV(1-C10/2,C9-1)

(6)计算置信区间下限:在单元格C14中输入公式=(C9-1)*C11/C12 (7)计算置信区间上限:在单元格C15中输入公式=(C9-1)*C11/C13.

当然,读者可以在输入数据后,直接输入如下两个表达式计算两个置信限:

=(count(b3:c7)-1)*var(b3:c7)/chiinv(0.1/2, count(b3:c7)-1) =(count(b3:c7)-1)*var(b3:c7)/chiinv(1-0.1/2, count(b3:c7)-1)

2.2 两正态总体均值差与方差比的区间估计

当?12 =??22 =??2但未知时?1-?2的置信区间

??11???. n1n2??2.2.1

置信区间为 ??x?y??t?(n1?n2?2)Sw?2 例4 在甲,乙两地随机抽取同一品种小麦籽粒的样本,其容量分别为5和7,分析其蛋白质含量为

甲:12.6 13.4 11.9 12.8 13.0

乙:13.1 13.4 12.8 13.5 13.3 12.7 12.4

蛋白质含量符合正态等方差条件,试估计甲,乙两地小麦蛋白质含量差μ1-μ2所在