2017-2018学年(新课标)北师大版高中数学必修三
§5 用样本估计总体
[读教材·填要点]
1.用样本估计总体的两种情况 (1)用样本的分布估计总体的分布. (2)用样本的数字特征估计总体的数字特征. 2.频率分布直方图
在频率分布直方图中,纵轴表示
fi
,数据落在各小组内的频率用频率直方图的面积来Δxi
表示,各小长方形的面积的总和等于1.
3.频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来接近于一条光滑曲线.
[小问题·大思维]
1.将数据的样本进行分组的目的是什么?
提示:从样本中的一个个数字中很难直接看出样本所包含的信息,通过分组,并计算其频率,目的是通过描述样本数据分布的特征,从而估计总体的分布情况.
2.频率分布直方图中,每个小长方形的面积表示什么含义? 提示:表示相应各组的频率.
[研一题]
[
例
1]
已
知
一
个
样
本
:
30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.
(1)列出样本的频率分布表.
(2)画出频率分布直方图和频率分布折线图.
(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少? [自主解答] (1)计算极差:30-21=9. 决定组距和组数:取组距为2. 91
∵=4,∴共分5组. 22
决定分点,使分点比数据多一位小数.
并把第1小组的分点减小0.5,即分成如下5组: 20.5~22.5,22.5~24.5,24.5~26.5, 26.5~28.5,28.5~30.5. 列出频率分布表如下:
分组 20.5~22.5 22.5~24.5 24.5~26.5 26.5~28.5 28.5~30.5 合计 (2)作出频率分布直方图如下:
个数累计 正 20 频数 2 3 8 4 3 20 频率 0.1 0.15 0.4 0.2 0.15 1.00 fi Δxi0.05 0.075 0.2 0.1 0.075
取各小长方形上的中点并用线段连接就构成了频率分布折线图,如上图. (3)由频率分布表和频率分布直方图观察得:
样本值出现在23~28之间的频率为0.15+0.40+0.2=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.
[悟一法]
绘制频率分布直方图的具体步骤: (1)求极差:
一组数据的最大值与最小值的差称为极差. (2)决定组距与组数:
数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多,当样本容量不超过120时,按照数据的多少,常分成5~12组.为方便起见,组距的选择应力求“取整”.
(3)将数据分组:
通常对组内数值所在区间取左闭右开区间,最后一组取闭区间. (4)列频率分布表:
计算各小组的频率,作出频率分布表.
说明:制作好频率分布表以后,可利用各组的频率之和为1来检验该表是否正确. (5)画出频率分布直方图:
依据频率分布表画出频率分布直方图.
[通一类]
1.下表给出了某校从500名12岁男孩中随机抽选出的120人的身高情况(单位:cm): 身高范围 人数 身高范围 人数 [122,126) 5 [142,146) 20 [126,130) 8 [146,150) 11 [130,134) 10 [150,154) 6 [134,138) 22 [154,158) 5 [138,142) 33 (1)列出样本频率分布表; (2)画出频率分布直方图;
(3)估计身高低于134 cm的人数占总人数的百分比. 解:(1)样本频率分布表如下所示:
分组 [122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158) 合计
(2)频率分布直方图如图所示.
频数 5 8 10 22 33 20 11 6 5 120 频率 0.04 0.07 0.08 0.18 0.28 0.17 0.09 0.05 0.04 1.00