第六章样本及抽样分布
【基本要求】1、理解总体、个体和样本的概念;
2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。
【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——?2分布,t分布,
F分布;分位数的理解和计算。
【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】
§6.0 前 言
前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。
§6.1 随机样本
1
一、总体与样本 1.总体、个体
在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。
例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。
但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。
定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。
我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。
例1:考察一块试验田中小麦穗的重量:
X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x
2
对应的分布:F(x)?P{??x}?重量?x的麦穗数总麦穗数??2??1x??e?(t??)22?2dt~N(?,?2)0?x???
例2:考察一位射手的射击情况:
X=此射手反复地无限次射下去所有射击结果全体;
每次射击结果都是一个个体(对应于靶上的一点)
?1射中个体数量化x??
?0未中1在总体中的比例p为命中率 0在总体中的比例1?p为非命中率
总体X由无数个0,1构成,其分布为两点分布B(1,p) P{X?1}?p,P{X?0}?1?p 2.样本与样本空间
为了对总体的分布进行各种研究,就必需对总体进行抽样观察。 抽样——从总体中按照一定的规则抽出一部分个体的行动。
一般地,我们都是从总体中抽取一部分个体进行观察,然后根据观察所得数据来推断总体的性质。按照一定规则从总体X中抽取的一组个体(X1,X2,?,Xn)称为总体的一个样本,显然,样本为一随机向量。
为了能更多更好的得到总体的信息,需要进行多次重复、独立的抽样观察(一般进行n次),若对抽样要求①代表性:每个个体被抽到的机会一样,保证了X1,X2,?,Xn的分布相同,与总体一样。②独立性:X1,X2,?,Xn相互独立。那么,符合“代表性”和“独立性”要求的样本
(X1,X2,?,Xn)称为简单随机样本。易知,对有限总体而言,有放回的随机样本为简单随机样本,无放回的抽样不能保证X1,X2,?,Xn的独立性;但对无限总体而言,无放回随机抽样也得到简单随机样本,我们本书则主要研究简单随机样本。
3