.
统计、统计案例(自学)
1.简单随机抽样 2.系统抽样的步骤
例题1、(2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机
编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为( ) A.7
B.9
C.10
D.15
3.分层抽样
例题2、 (2011·福建)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现
用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为 A.6
例题3、200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采
用系统抽样方法,按1~200编号分为40组,分别为1~5,6~10,…, 196~200,第5组抽取号码为22,第8组抽取号码为________.若 采用分层抽样,40岁以下年龄段应抽取__________人.
4.频率分布直方图
(1)在频率分布直方图中,纵轴表示示,各小长方形的面积总和等于1.
(2)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.
(3)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
例题4、(2011·浙江)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取20 名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图) 根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数
.
( )
B.8 C.10 D.12
频率
,数据落在各小组内的频率用各小长方形的面积表组距
.
________.
5. 用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数
例题5、某中学社会实践小组调查了200辆汽车通过某一段公路时的时速,制作了样本
的频率分布直方图.(设总体在各时速段分布均匀) (Ⅰ)估计总体数据的众数、中位数;
(Ⅱ)估计总体数据的平均数及数据落在[50,68)中的频率.
(2)样本方差、标准差
例题6、(1)如右图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 ( )
A.84,4.84 C.85,4
B.84,1.6 D.85,1.6
(2)(2012·山东)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.众数
B.平均数 D.标准差
C.中位数
6. 两个变量的线性相关 (1)正相关
在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)负相关
.
.
在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
例题7、对变量x,y有观测数据(xi,yi) (i=1,2,…,10),得散点图(1);对变量u、v有观测数据(ui,vi) (i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关
7. 回归方程 (1)最小二乘法
求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法. (2)回归方程
^
^
^
方程y =b x+a 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,
^
^
yn)的回归方程,其中a ,b 是待定参数.回归直线必过样本点的中心(x,y)
ni=1
ni=1
(3)相关系数 r=
∑ ?xi-x??yi-y?
2ni1
;
2
∑ ?xi-x?∑ ?yi-y?=
当r>0时,表明两个变量正相关; 当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
例题8、 已知变量x,y具有线性相关关系,测得一组数据如下:(2,30),(4,40),(5,60),(6,50),
(8,70),若它们的回归直线的斜率为6.5,则在这些样本点中任取一点,它在回归直线上 方的概率为
2
A. 5
.
4D. 5
( )
3B. 51C. 5