数理统计故事

http://211.71.86.13:8081/web/jp/glt

j/web/C_Page09_12.htm

1.分赌本问题

A、B二人赌博,各出注金a元,每局个人获胜概率都是1/2,约定:谁先胜S局,即赢得全部注金2a元,现进行到A胜S1局、B胜S2局(S1与S2都小于S)时赌博因故停止,问此时注金2a应如何分配给A和B才算公平?此问题文字上最早见于1494年帕西奥利的一本著作,是对S?6,S1?5和S2?2的情况。

由于对“公平分配”一词的意义没有一个公认的正确理解,在早期文献中出现过关于此问题的种种不同的解法,如今看来都不正确。例如,帕西奥利本人提出按S1:S2的比例分配。塔泰格利亚则在1556年怀疑找到一种数学解法的可能性,他认为这是一个应由法官来解决的问题,但他也提出了如下的解法:若S1?S2,则A取回自己下的注a,并取走B下的注的(S1?S2)/S,这等于按(S?S1?S2):(S?S1?S2)的比例瓜分注金。法雷斯泰尼在1603年根据某种理由,提出按(2S?1?S1?S2):(2S?1?S1?S2)的比例分配。卡丹诺在其1539年的著作中,通过较深的推理提出了一种解法:记r1?S?S1,r2?S?S2。把注金按r2(r2?1):r1(r1?1)之比分给A和B。他这个解法如今看来虽然仍不正确,但有一个重要之点,即他注意到起作用的是S1,S2与S的差距,而不在其本身。

这个问题的症结在于:他关乎各人在当时状况下的期望值。从以上这些五花八门的解法,似乎可以认为,这些作者已多少意识到这一点,但未能明确期望与概率的关系。而此处有关的是:假定赌博继续进行下去,各人最终取胜的概率。循着这个想法问题很易解决:至多再赌r?r1?r2?1局,即能分出胜负。为A获胜,他在这r局中至少须

r?r??r?2pA??i?r?1?i?胜r1局。因此按二项分布,A取胜的概率为??,而B取胜

的概率为pB?1?pA。注金按pA:pB之比分配给A和B,因2apA和2apB是

A、B在当时状态下的期望值。这个解是巴斯噶(B.Pascal, 1623~1662)在1654年提出的。他用了两种方法,其一是递推公式法,其二是用“巴斯噶三角”(即杨辉三角)。1710年,蒙特姆特在一封信中给出了我们在前面写出的解法,且不必规定二人的获胜概率相同。后来他又把此问题推广到多个赌徒的情形。

分赌本问题在概率史上起的作用,在于通过这个在当时来说较复杂的问题的探索,对数学期望及其与概率的关系,有了启示。有的解

法,特别是巴斯噶的解法,使用或隐含了若干直到现在还广为使用的计算概率的工具。如组合法、递推公式、条件概率和全概率公式等。可以说,通过对这个问题的研究,概率计算从初期简单计数步入较为精细的阶段。

巴斯噶与费尔马(P. de Fermat,1601~1665)的名字,对学习过

中学以上数学的人来说,想必不陌生。巴斯噶三角,在我国称杨辉三角,中学教科书中已有提及。至于费尔马,因其“费尔马大定理”(不

nnnx,y,z,xyx?0x?y?zn?3存在整数和整数,使) 于近年得到证明,

2. 巴斯噶与费尔马的通信

名声更远播数学圈子之外。费尔马在数学上的名声主要因其数论方面

的工作,其在概率史上占到一席地位,多少有些出乎偶然——由于他与巴斯噶在1654年7~10月间来往的7封信件,其中巴致费的有3封。

这几封信全是讨论具体的赌博问题。与前人一样,他们用计算等可能的有利与不利情况数,作为计算“机遇数”即概率的方法(他们没有使用概率这个名称。与前人相比,他们在方法的精细和复杂性方面大大前进了。他们广泛使用组合工具和递推公式,初等概率一些基本规律也都用上了。他们引进了赌博的值(value)的概念,值等于赌注乘以获胜概率。3年后,惠更斯改“值”为“期望” (expectation)这就是概率论的最重要概念之一——(数学)期望的形成和命名过程。前文已指出:此概念在更早的作者中已酝酿了一段时间。这些通信中讨论的一个重要问题之一是分赌本问题,还讨论了更复杂的输光问题:甲、乙二人各有赌本a和b元(a、b为正整数),每局输赢1元,要计算各人输光的概率。这个问题拿现在的标准看也有相当的难度。由此也可看出这组通信达到的水平及其在概率论发展史上的重要性。有的学者,如丹麦概率学者哈尔德,认为巴、费2人在1654年的这些信件奠定了概率论的基础。这话有相当的道理,但也应指出,这些通信的内容是讨论具体问题,没有提炼出并明确陈述概率运算的原则性内容。例如,他们视为当然地使用了概率加法和乘法定理。但未将其作为一般原则凸现出来。

促使巴、费2人进行这段通信的,是一个名叫德梅尔的人,他曾向巴斯噶请教几个有关赌博的问题。1564年7月29日巴斯噶首先给费尔马写信,转达了这些问题之一,请费尔马解决。所提问题并不难,但不知何以巴斯噶未亲自回答:将两颗骰子掷24次,至少掷出一个

241?(35/36)?0.4914)1/2“双6”的机遇小于(其值为。但从另一方面看,

投两个骰子只有36种等可能结果,而24占了36的2/3,这似乎有矛

盾,如何解释。现今学过初等概率论的读者都必能毫无困难地回答这个问题。

巴、费通信中涉及的有关分赌本问题的解法,包含了一些在当时看很先进且直到现在仍广为使用的想法和技巧,值得一述。

以r1和r2分别记为取得胜利,A、B尚须赢得的赌局数。巴斯噶认识到,注金的公正分配只应与r1和r2有关。因为若赌博继续下去,A(或B)最终取胜的概率,只与r1和r2有关。记此概率为e(r1,r2),则有边界条件: 且成立递推公式

e(r1,r2)?e(0,r2)?1,当r2?0; e(r1,0)?0,当r1?0;

e(a,a)?12, (1)

?e(r1?1,r2)?e(r1,r2?1)?2. (2)

巴斯噶在此用了全概率公式,即考虑若再赌一局,有“A胜”、“B胜”两种可能。巴斯噶由(1)、(2)出发,依次算出e(2,1),e(1,2),e(3,1),e(1,3),e(3,2),e(2,3),?,对其值进行观察,综合出一般解的形式:

.

(3)

为了证明,先验证(3)适合边界条件(1),这并不难。巴斯噶用归纳法证明(3)适合(2),也很容易,读者可以一试。

i?0

e(r1,r2)??Cir1?r2?12?(r1?r2?1)r2?1费尔马的解法有所不同,不妨设r1?r2。为A最终取胜,所再赌的局数可能为r1,r1?1,?,r1?r2?1(完备事件群),期间B取胜的局数

i?0,1,?,r2?1。若B胜i局,则到A最终取胜止再赌了r1?i局,其中前r1?i?1局中A胜r1?1局,而第r1?i局为A胜。这事件的概率为

?i?1?(r1?i?1)r1?i?1?(r1?i)?1Crr11?2?2?C1r1?12.

在得到这一结果时已用到了二项式定理及概率乘法定理。对

i?0,1,?,r2?1相加,得(3)。

?(r1?i)1?i?1e(r1,r2)??Crr2?11i?0r2?1. (4)

这里隐含了使用概率加法定理。由以上可以看出,巴、费二人在当时已了解并使用了我们现今初等概率计算中得主要工具。(3)、(4)两个解在形式上很不一样,但不难由一个化到另一个,这一工作留给读者。

3. 惠更斯的《机遇的规律》

惠更斯是一个有多方面成就的、在当时声名与牛顿相若的大科学家。人们熟知他的贡献之一是单摆周期公式T?2?l/g。他在概率论的早期发展史上也占有重要地位,其主要著作《机遇的规律》出版于1657年,出版后得到学术界的高度重视,在欧洲作为概率论的标准教本长达50年之久。

该著作的写作方式不大像一本书,而更像一篇论文。他从关于公平赌博(fair game)的值的一条公理出发,推出关于“期望”(这是他首先引进的术语)的3条定理。基于这些定理并利用递推法等工具,惠更斯解决了当时感兴趣的一些机遇博弈问题。最后,他提出了5个问题,对其中的3个给出了答案但未加证明。

3条定理加11个问题,被称为惠更斯的14个命题。前3条如下述:

命题1 若某人在赌博中以等概率1/2得a、b元,则其期望为(a?b)/2元。

命题2 若某人在赌博中以等概率1/3得a、b和c元,则其期望为(a?b?c)/3元。

命题3 若某人在赌博中以概率p,q(p?q?1)得a、b元,则其期望为pa?qb元。

看了这些命题,现代的读者或许会感到惶惑:为何一个应取为定义的东西,要当作需要证明的定理? 答案在于,这反映了当时对纯科学的一种公认的处理方法,即应从尽可能少的“第一原理”(first principle,即公理)出发,把其他内容推演出来。惠更斯只从一条公理出发而导出上述命题,其推理颇为别致,此处不细述。

这几个命题是期望概念的一般化。此前涉及或隐含这一概念只是相当于命题3中b?0的特例,即注金乘取胜概率,因而本质上没有超出概率这个概念的范围。惠更斯的命题将其一般化,使这个重要概念定型的决定性的一步。实际上,据惠更斯的命题不难证明:若某人在赌博中分别以概率p1,?,pk(p1??pk?1)得a1,?,ak元,则其期望为

p1a1???pkak。这与现代概率论教科书中关于离散随机变量的期望的

定义完全一致。

余下的11个命题及最后的5个问题,都是在形形色色的赌博取胜约定下,去计算各方取胜的概率,其中命题4~9是关于2人和多人的分赌本问题。对这些及其他问题,惠更斯都用了现行概率论教科书中初等概率计算方法,通过列出一定的方程求解,大体上与巴斯噶的做法相似。这种方法后来被伯努利称为“惠更斯的分析方法”。最

后5个问题较难一些,其解法的技巧性也较强。现举其一为例:A、B二人约定按ABBAABBAABB?掷两颗骰子,即A先掷一次,然后从B开始轮流各掷两次。若A掷出和6点,则A胜;若B掷出和7点,则B胜。求A、B获胜的概率。

A在一次投掷时掷出和为6的概率pA?5/36,而B在一次投掷时掷出和为7的概率pB?6/36?1/6。记qA?1?pA,qB?1?pB,又记ei为在第i?1次投掷完时A、B都未取胜,在这一条件下A最终取胜的概率。利用全概率公式,并注意到约定的投掷次序,可以列出方程组:

e1?pA?qAe2,e2?qBe3,e3?qBe4,e4?pA?qAe1.

由此容易得出

2pA(1?qAqB)10355e1??22(1?qAqB)22631,

略小于1/2。故此赌法对A不利。

机遇博弈在概率概念的产生及其运算规则的建立中,起了主导的作用。这一点不应当使人感到奇怪:虽说机遇无时不在,但要精确到数量上去考虑,在几百年前那种科学水平之下,只有在像掷骰子这类很简单的情况下才有可能。但这门学科建立后,即脱离赌博的范围而找到了多方面的应用。这也是一个有趣的例子,表明一种看来无益的活动(如赌博),可以产生对人类文明极有价值的副产物。

把概率论由局限于对赌博机遇的讨论拓展出去的转折点和标志,应是1713年伯努利划时代著作《推测术》的出版,是在惠更斯的《机遇的规律》出版后56年。截至惠更斯这一著作为止,内容基本上全限于掷骰子等赌博中出现各种情况的概率的计算,而伯努利这本著作不仅对以前的成果作了总结和发挥,更提出了“大数定律”这个无论从理论和应用角度看都有着根本重要性的命题,可以说其影响一直达到今日而不衰。其对数理统计学的发展也有不可估量的影响,许多统计方法和理论都是建立在大数定律的基础上。有的概率史家认为,这本著作的出版,标志着概率概念漫长的形成过程的终结于数学概率论的开端。

假定有一个事件A。根据某种理论,我们算出其概率为P(A)?p。这理论是否正确呢?一个检验的方法就是通过实际观察,看其结果与此论理论的推论——P(A)?p是否符合。或者,一开始我们根本就不知道P(A)等于多少,而希望通过实际观察去估计其值。这些包含了数理统计学中两类重要问题的形式——检验与估计。这个检验或估计概率p的问题,是数理统计学中最常见、最基本的两个问题。

要构造具体例子,最方便的做法是使用古典概率模型。拿一个缶子,里面装有大小、质地一样的球a?b个,其中白球a个,黑球b个。

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4