第五章统计量及其分布 下载本文

第五章 统计量及其分布

一、教材说明

本章内容包括:总体与样本,样本数据的整理与显示,统计量及其分布,三大抽样分布.本章的基本概念和重要结论是学习数理统计的基础.

1、教学目的与教学要求

1)掌握数理统计的总体、样本、样本经验分布函数、统计量及常用统计量等基本概念. 2)掌握三大分布的定义,并能熟练应用来求随机变量的分布. 3)牢记Fisher定理的内容及其三大推论.

4)使学生了解数理统计研究问题的方法与概率论研究问题方法的不同. 5)了解如何对样本数据进行整理与现实. 2、本章重点与难点

本章重点是数理统计的基本概念、三大分布的定义、Fisher定理及其推论.难点是Fisher定理结合三大分布来求随机变量的分布.

二、教学内容

本章共分总体与样本、样本数据的整理与显示、统计量及其分布、三大抽样分布等4节来讲述本章的基本内容.

§5.1总体与样本

教学目的:要求学生理解数理统计的两个基本概念:总体和样本,以及与这两个基本

概念相关的统计基本思想和样本分布.

教学重点: 掌握数理统计的基本概念和基本思想. 教学难点:掌握数理统计的基本概念和基本思想.

5.1.1 总体与样本

在一个统计问题中,把研究对象的全体称为总体,构成总体的每个成员称为个体.对于实际问题,总体中的个体是一些实在的人或物.比如,我们要研究某大学的学生身高情况,则该大学的全体学生构成问题的总体,而每一个学生即是一个个体.事实上,每一个学生有许多特征:性别、年龄、身高、体重等等,而在该问题中,我们关心的只是该校学生的身高如何,对其他的特征暂不考虑.这样,每个学生(个体)所具有的数量指标——身高就是个体,而所有身高全体看成总体.这样,抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现机会多,有的出现机会小,因此用一个概率分布去描述和归纳总体是合适的,从这个意义上说:

总体就是一个分布,而其数量指标就是服从这个分布的随机变量.

例5.1.1 考察某厂的产品质量,将其产品分为合格品和不合格品,并以0记合格品,以1记不格品,若以p表示不合格品率,则各总体可用一个二点分布表示:

X p 0 1 1-p p

不同的p反映了总体间的差异.

在有些问题中,我们对每一研究对象可能要观测两个或更多个指标,此时可用多维随机

向量及其联合分布来描述总体.这种总体称为多维总体.

若总体中的个体数是有限的,此总体称为有限总体;否则称为无限总体.实际中总体中的个体数大多是有限的,当个体数充分大时,将有限总体看作无限总体是一种合理抽象.

5.1.2 样本与简单随机样本

样本

为了了解总体的分布,从总体中随机地抽取n个体,记其指标值为 x1,x2,?,xn, 则x1,x2,?,xn 称为总体的一个样本,n称为样本容量或简称为样本量,样本中的个体称为样品.

首先指出,样本具有所谓的二重性:一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此样本是随机变量,用大写字母 X1,X2,?,Xn 表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此样本又是一组数值,此时用小写字母

x1,x2,?,xn 表示.简单起见,无论是样本还是其观测值,均用x1,x2,?,xn 表示.

每个样本观测值都能测到一个具体的数值,则称该样本为完全样本,若样本观测值没有具体的数值,只有一个范围,则称这样的样本为分组样本.从而知道分组样本与完全样本相比在信息上总有损失,但在实际中,若样本量特别大,用分组样本既简明扼要,又能帮助人们更好地认识总体.

例5.1.4 略. 简单随机样本

从总体中抽取样本可有不同的抽法,为了能由样本对总体作出较可靠的推断就希望样本能很好地代表总体.这就需要对抽样方法提出一些要求,最常用的有如下两个要求:

1)样本具有随机性:要求每一个个体都有同等机会被选入样本,这便意味着每一样品

xi与总体X有相同的分布.

2)样本要求有独立性:要求每一样品的取值不影响其它样品的取值,这便意味着

x1,x2,?,xn相互独立.

若样本x1,x2,?,xn是n个相互独立的具有同一分布的随机变量,则称该样本为简单随机样本,简称为样本.

注(1)若总体X的分布函数为F(x),则其样本的联合分布函数为?F(xi)

i?1n(2)若总体X的密度函数为p(x),则其样本的联合密度为?p(xi)

i?1n(3)若总体X的分布列为 p(xi),则其样本的联合分布列为?p(xi)

i?1n(4)对有限总体不放回抽样,若总体中有几个个体,抽取样本容量为n,当n??N (

n?0.1)时,不放回抽样得到的样本可认为是简单随机样本. N例5.1.5 设有一批产品共N个,需进行抽样检验以了解其不合格品率p,现从中抽出n

个逐一检查它们是否是不合格品,记合格品为0,不合格品为1.则总体为一个二点分布:

P(X?1)?p,P(X?0)?1-p.设 x1,...,xn为该总体的一个样本,采用不放回抽样得到.

这时,第二次抽到不合格品的概率依赖于第一次抽到的是否是不合格品:

P(x2?1x1?1)?Np?1 N?1NpP(x2?1x1?0)?

N?1但当N很大时,上述两个概率近似都等于p,所以当N很大,而n不大时,不放回抽样得到的样本可近似看成简单随机样本.

§5.2样本数据的整理与显示

教学目的:要求学生熟练掌握样本数据整理与显示的常用方法.

教学重点:熟练掌握求经验分布函数的方法,会用直方图和茎叶图的方法求频率分布. 教学难点: 样本数据整理与显示的常用方法的灵活应用.

教学内容:本节内容包括经验分布函数,频数频率分布表,直方图和茎叶图. 5.2.1 经验分布函数

定义 设x1,x2,?,xn是取自总体分布函数为F(x)的样本,若将样本观测值从小到大进行排列为x(1),x(2),?,x(n),则x(1)?x(2)??x(n)为有序样本,如下函数

?0,当x?x(1)??kFn(x)??,当x(k)?x?x(k?1),k?1,2,?n??1,当x?x(n)称为经验分布函数.

,n?1

*显然,Fn(x)是单调非降右连续的跳跃函数(阶梯函数),在点x?xk处有间断,在每

,k?1,2,3,?,n),且0?Fn(x)?1,limFn(x)?0,limFn(x)?1,个间断点的跃度为(x???x???1n它满足分布函数的三个性质,所以必是一个分布函数.

例5.2.1某食品厂生产听装饮料,现从生产线上随机抽取5听饮料,称得其净重为:351 347 355 344 351,求此样本的经验分布函数.

略.

例 某厂从一批荧光灯中抽出10个,测其寿命的数据(单位千时)如下:

95.5, 18.1, 13.1, 26.5, 31.7, 33.8, 8.7, 15.0, 48.8, 48.3

求该批荧光灯寿命的经验分布函数Fn(x)(观察值).