2019-2020学年数学人教A版选修2-3检测:3.2独立性检验的基本思想及其初步应用 Word版含解析

3.2 独立性检验的基本思想及其初步应用

填一填

1.与列联表相关的概念 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表:

①列出的两个分类变量的频数表,称为列联表.

②一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:

y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.

2.等高条形图

等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.

3.独立性检验的基本思想

(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.

n?ad-bc?2

2(2)公式:K=,其中n=a+b+c+d为样本容量. ?a+b??c+d??a+c??b+d?

(3)独立性检验具体步骤 ①确定α,根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.

②计算K2,利用公式计算随机变量K2的观测值k.

③下结论,如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过a; 否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”. 判一判 判断(正确的打“√”,错误的打“×”) 1.分类变量中的变量与函数中的变量是同一概念.(×) 2.独立性检验的方法就是反证法.(×)

3.独立性检验中可通过统计表从数据上说明两分类变量的相关性的大小.(√)

4.列联表频率分析法、等高条形图可初步分析两分类变量是否有关系,而独立性检验中K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.(√)

5.2×2列联表中ad-bc越大,说明X与Y关系越强.(√)

6.在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.(×)

7.等高条形图与表格相比,能更直观地反映出相关数据总体状况.(√)

8.如果有99%的把握认为“X与Y有关系”,那么具体算出的数据满足k>6.635.(√)

想一想 1.应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的吗? 提示:不一定.所有的推断只代表一种可能性,不代表具体情况. 2.独立性检验的基本思想与反证法的思想有何相似之处? 提示: 反证法 假设检验 要证明结论A 要确认“两个变量有关系” 假设该结论不成立,即假设结论“两个变量在A不成立的前提下进行推理 没有关系”成立,在该假设下计算K2 由观测数据计算得到的K2很大,则在一定可推出矛盾,意味着结论A成立 信程度上说明假设不合理 根据随机变量K2的含义,可以通过K2的大小没有找到矛盾,不能对A下任何结论,即反来判断“两个变量有关系”这一结论成立有证法不成功 多大把握 3.某同学在独立性检验两个分类变量X与Y的关系时,计算发现K2的观测值k=6.023,可以得到什么结论,如何解释?

提示:P(K2≥5.024)≈0.025,而6.023≥5.024,所以可断言X与Y有关系的可信程度为97.5%.同时做出两者有关系这个论断也可能是错误的,但出错的概率不会超过2.5%,因为这是由样本得到的结论. 思考感悟:

练一练 1.调查男女学生购买食品时是否看出厂日期与性别无关系时,最有说服力的是( ) A.期望 B.方差 C.正态分布 D.独立性检验

解析:要判断两个事件是否相关时,用独立性检验. 答案:D

2.下面的等高条形图可以说明的问题是________(填序号).

①“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的; ②“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同; ③此等高条形图看不出两种手术有什么不同的地方;

④“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同

的,但是没有100%的把握.

答案:④ 3.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填“有关”或“无关”)

解析:∵K2的观测值k=27.63,∴k>10.828,∴在犯错误的概率不超过0.001的前提下认为打鼾与患心脏病是有关的.

答案:有关

知识点一 1.下面是2×2列联表

x1 x2 总计 则表中a,b处的值为( )

A.94,96 B.52,40 C.52,59 D.59,52

解析:a=73-21=52,b=a+7=52+7=59. 答案:C

2.用2×2列联表分析两分类变量间的关系

假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:

y1 y2 x1 10 18 x2 m 26 则当m取下面何值时,X与Y的关系最弱( ) A.8 B.9 C.14 D.19

解析:对于A:|ad-bc|=|10×26-18×m|=10×26-18×8=116;对于B:|ad-bc|=|10×26-18×m|=10×26-18×9=98;对于C:|ad-bc|=|10×26-18×m|=10×26-18×14=8;对于D:|ad-bc|=|10×26-18×m|=|10×26-18×19|=82;比较可得:当m=14时,|ad-bc|的值最小,故X与Y的关系最弱;故选C.

答案:C

知识点二 等高条形图 3.有两个分类变量X与Y,其2×2列联表如下表所示:

Y1 Y2 20-a X1 a X2 15-a 30+a 其中a,15-a均为大于5的整数,要至少有95%的把握认为X与Y之间有关,则a等于( ) A.8 B.9

y1 a 7 b y2 21 20 41 总计 73 27 100 等高条形图

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4