2013版高考数学一轮复习精品学案:10.3统计案例

2013版高考数学一轮复习精品学案:第十章 统计、统计案例

10.3统计案例

【高考新动向】

一、考纲点击

1.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用; 2.了解回归分析的基本思想、方法及其简单应用. 二、热点提示

1.本部分主要内容是变量的相关性及其几种常见的统计方法.在高考中主要是以考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来了解一些基本的统计思想;

2.本部分在高考中多为选择、填空题,也有可能出现解答题,都为中低档题.

【考纲全景透析】

1.回归分析 Z,xx,k (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法;

(2)随机误差:线性回归模型用y?bx?a?e表示,其中a和b为模型的未知数,e称为随机误差. (3)样本点的中心

在具有线性相关关系的数据(x1,y1),(x2,y2),式分别为:

,(xn,yn)中,回归方程的截距和斜率的最小二乘估计公

??b?(x?x)(y?y)iii?1n?(x?x)ii?1n?. ??y??bx,a21n1n其中x??xi,y??yi,(x,y)称为样本点的中心.

ni?1ni?1(4)相关系数

①r??(x?x)(y?y)iii?1n?(x?x)?(y?y)2iii?1i?1nn;

2②当r?0时,表明两个变量正相关; 当r?0时,表明两个变量负相关.

r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两

个变量有很强的线性相关性.

2.残差分析 (1)总偏差平方和

把每个效应(观测值减去总的平均值)的平方加起来即:(2)残差

数据点和它回归直线上相应位置的差异(yi?yi)是随机误差的效应,称ei?yi?yi为残差. (3)残差平方和

?(yi?1ni?y)2

?(y?y)iii?1n2.

(4)相关指数R?2?(y?y)iin2?(y?y)ii?1i?1n

2R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中, R2表示解释变

量对预报变量变化的贡献率, R越接近于1,表示回归的效果越好.

3.独立性检验

(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.

(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,y1}和{x2,y2},其样本频数列联表(称为2×2列联表)为

2×2列联表

2y1 a y2 总计 x1 x2 总计 b a?b c d b?d

c?d a?b?c?d a?c n(ad?bc)2构造一个随机变量K?,其中a?b?c?d为样本容量.

(a?b)(c?d)(a?c)(b?d)2(3)独立性检验

利用随机变量K2来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.

注: 在独立性检验中经常由K2得到观测值k,则k=K2是否成立?(K2与k的关系并不是k=K2,k是K2的观测值,或者说K2是一个随机变量,它在a,b,c,d)取不同值时,K2可能不同,而k是取定一组数a,b,c,d后的一个确定的值.

【热点难点精析】

(一)线性回归分析 ※相关链接※

1.首先利用散点图判断两个变量是否线性相关. 2.求回归方程y?bx?a.

(1)线性回归方程中的截距a和斜率b都是通过样本估计而来的,存在着误差,这种误差可能导致预报结果的偏差.

(2)回归方程y?bx?a中的b表示x增加1个单位时y的变化量为b. (3)可以利用回归方程y?bx?a预报在x取某一个值时y的估计值. 3.相关系数r

利用相关系数r来衡量两个变量之间的线性相关的强弱. 4.建立回归模型的步骤

(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.

(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等). (3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y?bx?a). (4)按一定规则估计回归方程中的参数(如最小二乘法).

(5)得出结果后分析残差是否异常(个别数据对应残差过大,或残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否适合等.

注:回归方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归方程的适用范围,否则没有实用价值.

※例题解析※

〖例〗测得某国10对父子身高(单位:英寸)如下:

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4