第一章 统计
[自我校对] ①分层抽样 ②系统抽样 ③扇形统计图 ④茎叶图 ⑤频率分布直方图 ⑥频率折线图 ⑦最小二乘法 ⑧线性回归方程
抽样方法的选择与应用
1.进行系统抽样时,必须满足总体容量可以被样本容量整除.当不能整除时,应用简单随机抽样的方法从总体中剔除部分个体,其中剔除的个体数是总体中的个体数除以样本容量的余数.
2.进行分层抽样时,每层中所抽取的个数应按各层个体数在总体中所占的比例抽取,样本容量即抽样比=. 总体容量
样本容量
在实际操作中,应先计算出抽样比=,再按抽样比确定每层需要抽取的个体数:
总体容量样本容量
×该层个体数目.
总体容量
(1)在下列问题中,分别可以采用什么方法抽取样本?
a.从20台液晶电视中抽取4台进行检验;
b.某学校有300名教职员工,其中教师210人,行政人员35人,后勤服务人员55人,
为了解教职工对学校工作的满意度,需要抽取一个容量为60的样本;
c.从800辆车中抽取8辆进行检测.
(2)一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量(单位:辆)如下表:
舒适型 标准型 轿车A 100 300 轿车B 150 450 轿车C z 600 按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆. ①求z的值;
②用分层抽样的方法在C类轿车中抽取一个容量为5的样本.
【精彩点拨】 (1)研究统计问题的基本思想方法就是从总体中抽取样本,用样本估计总体,因此选择适当的抽样方法抽取具有代表性的样本对整个统计问题起着至关重要的作用.
(2)一般地,当总体中个体较多时,常采用系统抽样,当总体由差异明显的几部分组成时,常采用分层抽样.
【规范解答】 (1)a用简单随机抽样抽取样本即可.
b用分层抽样的方法抽取样本,不同职位的人的满意度是不同的. c用系统抽样比较合适,因为样本容量较大.
50
(2)①设该厂本月生产轿车n辆,由题意得=n10
,所以n=2 000,则z=2 000
100+300
-100-300-150-450-600=400.
②设所抽取的样本中有m辆舒适型轿车,因为用分层抽样的方法在C类轿车中抽取一个
400m容量为5的样本,所以=,解得m=2,即在C类轿车中抽取2辆舒适型轿车,3辆标
1 0005准型轿车.
[再练一题]
1.某高级中学有学生270人,其中一年级108人,二、三年级各81人.现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样、分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④20,57,84,111,138,165,192,219,246,270. 关于上述样本的下列结论中,正确的是( ) A.②③都不能为系统抽样 B.②④都不能为分层抽样 C.①④都可能为系统抽样 D.①③都可能为分层抽样
10
【解析】 按分层抽样时,在一年级抽取108×=4(人),在二年级、三年级各抽取
27010
81×=3(人),则在号码段1,2,…,108中抽取4个号码,在号码段109,110,…,189
270中抽取3个号码,在号码段190,191,…,270中抽取3个号码,①②③符合,所以①②③可能是分层抽样,④不符合,所以④不可能是分层抽样;如果按系统抽样时,抽取出的号码应该是“等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④都不能为系统抽样.
【答案】 D
用样本的频率分布估计总体分布 1.绘制频率分布直方图应注意的五个问题: (1)计算全距,需要找出这组数的最大值和最小值.当数据很多时,可选一个数当参照. (2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目.一般来说,数据越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且使第一组的起点比最小值稍微小一点.
(4)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.