统计的重要知识点总结和例题

.

统计、统计案例(自学)

1.简单随机抽样 2.系统抽样的步骤

例题1、(2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机

编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为( ) A.7

B.9

C.10

D.15

3.分层抽样

例题2、 (2011·福建)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现

用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为 A.6

例题3、200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采

用系统抽样方法,按1~200编号分为40组,分别为1~5,6~10,…, 196~200,第5组抽取号码为22,第8组抽取号码为________.若 采用分层抽样,40岁以下年龄段应抽取__________人.

4.频率分布直方图

(1)在频率分布直方图中,纵轴表示示,各小长方形的面积总和等于1.

(2)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.

(3)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.

例题4、(2011·浙江)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取20 名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图) 根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数

.

( )

B.8 C.10 D.12

频率

,数据落在各小组内的频率用各小长方形的面积表组距

.

________.

5. 用样本的数字特征估计总体的数字特征

(1)众数、中位数、平均数

例题5、某中学社会实践小组调查了200辆汽车通过某一段公路时的时速,制作了样本

的频率分布直方图.(设总体在各时速段分布均匀) (Ⅰ)估计总体数据的众数、中位数;

(Ⅱ)估计总体数据的平均数及数据落在[50,68)中的频率.

(2)样本方差、标准差

例题6、(1)如右图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 ( )

A.84,4.84 C.85,4

B.84,1.6 D.85,1.6

(2)(2012·山东)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( )

A.众数

B.平均数 D.标准差

C.中位数

6. 两个变量的线性相关 (1)正相关

在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关

.

.

在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线

如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.

例题7、对变量x,y有观测数据(xi,yi) (i=1,2,…,10),得散点图(1);对变量u、v有观测数据(ui,vi) (i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )

A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关

7. 回归方程 (1)最小二乘法

求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法. (2)回归方程

^

^

^

方程y =b x+a 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,

^

^

yn)的回归方程,其中a ,b 是待定参数.回归直线必过样本点的中心(x,y)

ni=1

ni=1

(3)相关系数 r=

∑ ?xi-x??yi-y?

2ni1

2

∑ ?xi-x?∑ ?yi-y?=

当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关.

r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.

例题8、 已知变量x,y具有线性相关关系,测得一组数据如下:(2,30),(4,40),(5,60),(6,50),

(8,70),若它们的回归直线的斜率为6.5,则在这些样本点中任取一点,它在回归直线上 方的概率为

2

A. 5

.

4D. 5

( )

3B. 51C. 5

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4