2013版高考数学一轮复习精品学案:第十章 统计、统计案例
10.3统计案例
【高考新动向】
一、考纲点击
1.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用; 2.了解回归分析的基本思想、方法及其简单应用. 二、热点提示
1.本部分主要内容是变量的相关性及其几种常见的统计方法.在高考中主要是以考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来了解一些基本的统计思想;
2.本部分在高考中多为选择、填空题,也有可能出现解答题,都为中低档题.
【考纲全景透析】
1.回归分析 Z,xx,k (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;
(2)随机误差:线性回归模型用y?bx?a?e表示,其中a和b为模型的未知数,e称为随机误差. (3)样本点的中心
在具有线性相关关系的数据(x1,y1),(x2,y2),式分别为:
,(xn,yn)中,回归方程的截距和斜率的最小二乘估计公
??b?(x?x)(y?y)iii?1n?(x?x)ii?1n?. ??y??bx,a21n1n其中x??xi,y??yi,(x,y)称为样本点的中心.
ni?1ni?1(4)相关系数
①r??(x?x)(y?y)iii?1n?(x?x)?(y?y)2iii?1i?1nn;
2②当r?0时,表明两个变量正相关; 当r?0时,表明两个变量负相关.
r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两
个变量有很强的线性相关性.
2.残差分析 (1)总偏差平方和
把每个效应(观测值减去总的平均值)的平方加起来即:(2)残差
数据点和它回归直线上相应位置的差异(yi?yi)是随机误差的效应,称ei?yi?yi为残差. (3)残差平方和
?(yi?1ni?y)2
?(y?y)iii?1n2.
(4)相关指数R?2?(y?y)iin2?(y?y)ii?1i?1n
2R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中, R2表示解释变
量对预报变量变化的贡献率, R越接近于1,表示回归的效果越好.
3.独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,y1}和{x2,y2},其样本频数列联表(称为2×2列联表)为
2×2列联表
2y1 a y2 总计 x1 x2 总计 b a?b c d b?d
c?d a?b?c?d a?c n(ad?bc)2构造一个随机变量K?,其中a?b?c?d为样本容量.
(a?b)(c?d)(a?c)(b?d)2(3)独立性检验
利用随机变量K2来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
注: 在独立性检验中经常由K2得到观测值k,则k=K2是否成立?(K2与k的关系并不是k=K2,k是K2的观测值,或者说K2是一个随机变量,它在a,b,c,d)取不同值时,K2可能不同,而k是取定一组数a,b,c,d后的一个确定的值.
【热点难点精析】
(一)线性回归分析 ※相关链接※
1.首先利用散点图判断两个变量是否线性相关. 2.求回归方程y?bx?a.
(1)线性回归方程中的截距a和斜率b都是通过样本估计而来的,存在着误差,这种误差可能导致预报结果的偏差.
(2)回归方程y?bx?a中的b表示x增加1个单位时y的变化量为b. (3)可以利用回归方程y?bx?a预报在x取某一个值时y的估计值. 3.相关系数r
利用相关系数r来衡量两个变量之间的线性相关的强弱. 4.建立回归模型的步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y?bx?a). (4)按一定规则估计回归方程中的参数(如最小二乘法).
(5)得出结果后分析残差是否异常(个别数据对应残差过大,或残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否适合等.
注:回归方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归方程的适用范围,否则没有实用价值.
※例题解析※
〖例〗测得某国10对父子身高(单位:英寸)如下: