第五章 常用概率分布
第四章 常用概率分布
随机变量(random variable)的性质取决于它的分布规律。本章介绍三个最常用的理论分布,包括离散型变量的二项分布(binomial distribution)与Poisson分布(Poisson distribution),以及连续型变量的正态分布(normal distribution)。医学研究中的很多随机现象可以用这三种分布之一进行描述。为便于教学,读者需要复习高等数学课程中已经学过的概率论基本知识。
第一节 二项分布 一、二项分布的概念与特征
先看一个小实验。一个袋子里有5个乒乓球,其中2个黄球,3个白球,我们进行盲法摸球游戏,每次摸1球,然后放回再摸。如此重复。先后摸5次,摸到黄球的次数可能是0次,可能是1次、2次等,也可能5次都摸到黄球。请问摸到黄球的次数为0的概率有多大?摸到黄球的次数为1的概率有多大?摸到黄球的次数为2的概率有多大?5次均摸到黄球的概率又是多大呢?你会算吗?
在这个实验中,由于黄球的比例是2/5,白球的比例是3/5。又,该实验为有放回的实验,因此每一次摸到黄球的概率是0.4,摸到白球的概率是0.6。如果5次里前X次摸到的是黄球,以后5-X次摸到的是白球,相应的概率是0.4X0.65?X。因为摸到黄球可能发生在5次中的任意X次中,因此5次里有X次摸到黄球的概率为C5X0.4X0.65?X。其中,C5X表示“5取X的组合数”。该实验有三个特点:① 各次摸球是彼此独立的;② 每次摸球只有二种可能的结果,或黄球或白球;③ 每次摸到黄球(或摸到白球)的概率是固定的。具备以上三点,n次中有X次摸到黄球的概率分布就是二项分布。
例4-1 用针灸治疗头痛,假定结果只有两种可能,不是“有效”就是“无效”,每一例有效的概率为π。某医生用此方法治疗头痛患者3例,2例有效的概率是多少?
用Ai表示第i例有效,Ai表示第i例无效。因为每例有效的概率相同,且各例的治疗结果之间彼此独立,3例患者中可以是其中的任意2例有效,所以3例
1
第五章 常用概率分布
中2例有效的概率为:
P(A1A2A3)?P(A1A2A3)?P(A1A2A3)?C?(1??)232
推而广之,医学研究中很多现象的观察结果是以两分类变量来表示的,如阳性与阴性,治愈与未愈,生存与死亡等。如果每个观察对象阳性结果的发生概率均为?,阴性结果的发生概率均为(1-?);且各个观察对象的结果是相互独立的,那么,重复观察n个对象,发生阳性结果的次数X的概率分布服从二项分布,记作B(n,?)。
二项分布的概率函数P(X)可用公式(4-1)来计算。
P(X)?CnX?X(1??)n?X (4-1)
其中
CnX?n!X!(n?X)! (4-2)
!为阶乘符号,n!?n(n?1)(n?2)?1,如3!=3×2×1,0!定义为1。
例4-2 如果例4-1中?=0.6,随机治疗3例,有效例数为0例、1例、2例和3例的概率各多大?1例及以上有效的概率多大?
根据(4-1)式,0例有效的概率为
00.60(1?0.6)(3?0)?0.43?0.064 C31例及以上有效的概率可表示为
P(X?1)?P(1)?P(2)?P(3)?0.288?0.432?0.216?0.936
同理,可算得有效例数分别为1、2和3的概率,见表4-1。
表4-1 治疗3例可能的有效例数及其概率
有效人数(X)
0
1 2 3
C3X
1 3 3 1
?X
0.60 0.6 0.6×0.6 0.6×0.6×0.6
(1-?)n-X 0.4×0.4×0.4
0.4×0.4 0.4 0.40
出现该结果的概率P(X)
0.064 0.288 0.432 0.216
由表4-1可知,由于只有4种可能结果,各种可能结果出现的概率之和为1,即?P?X??1。据此,1例及以上有效的概率又可表示为
P(X?1)?1?P(0)?1?0.064?0.936
2
第五章 常用概率分布
两者结果相同。
(三)二项分布的特征
二项分布的特征由二项分布的参数?以及观察的次数n决定。 1.二项分布的图形特征
在n次独立重复的试验中,若某事件发生的概率为?,则该事件的发生次数X服从二项分布。用图形表示,以X为横轴,以对应于X的概率P(X)为纵轴,对所有可能的X (0≤X≤n) 分别用垂直于横轴、长度为P(X)的线段表示相应的概率,得二项分布图。
从图形可知,二项分布的高峰在?=n?处或附近;? 为0.5时,图形是对称的;当?不等于0.5时,分布不对称,且对同一n,? 离0.5愈远,对称性愈差。对同一?,随着n的增大,分布趋于对称。当n→∞时,只要?不太靠近0或1,(特别是当n?和n(1-?)均大于5时),二项分布趋于对称。
P(x) 0.4 0.3 0.2 0.1 0.0
0 1 2 3
P(x) 0.4 0.3 0.2 0.1 0.0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
n=3,π=0.5 n=10,π=0.5
图4-1 π=0.5时,不同n值对应的二项分布
3
第五章 常用概率分布
P(x) 0.4 0.3 0.2 0.1
P(x) 0.4 0.3 0.2 0.1
0 1 2 3
0.0
0.0
0 1 2 3 4 5 6
P(x) 0.4 0.3 0.2 0.1 0.0
0 1 2 3 4 5 6 7 8 9 10
P(x) 0.4 0.3 0.2 0.1
0.0
0 1 2 3 4 5 6 7 8 9 1011 1 213 14 1 5
图4-2 π=0.3时,不同n值对应的二项分布
图4-1和图4-2 给出了?=0.5和 ?=0.3时不同n值对应的二项分布图。 2.二项分布的均数和标准差 例4-3 求例4-2资料的均数和方差。
在例4-2中,总共治疗三个患者 n=3,有效概率? =0.6,有效的人数可能为0个人,1个人,2个人或3个人,对应的概率分别为0.064,0.288,0.432和0.216。根据总体均数(又称数学期望,下略)和方差的定义,有效人数的均数为
E(X)??XP(X)?0?0.064?1?0.288?2?0.432?3?0.216?1.80
方差为
Var(X)?E?X?E(X)????X?E(X)?P(X)?(0?1.80)2?0.064?(1?1.80)2?0.288?...?(3?1.80)2?0.216?0.7222
事实上对于任何二项分布问题,如果每一次试验出现阳性结果的概率均为,?,进行n次独立重复试验,出现X次阳性结果,那么,可以证明(见附录)X的总体均数为
??n? (4-3)
4