2020版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3 下载本文

2019年

由P(A)=P(BC)=P(B)P(C),

则旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P(B)的估计值为0.62,

新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66, 故P(C)的估计值为0.66,

则事件A的概率估计值为P(A)=P(B)P(C)=0.62×0.66=0.409 2, ∴A发生的概率为0.409 2.

(2)根据箱产量的频率分布直方图得到列联表:

旧养殖法 新养殖法 总计

箱产量<50 kg 62 34 96 箱产量≥50 kg 38 66 104 总计 100 100 200 200×?62×66-38×34?

则K=≈15.705,

100×100×96×104

2

2

由15.705>6.635,

故有99%的把握认为箱产量与养殖方法有关. 反思与感悟 两个分类变量相关关系的判断

(1)等高条形图法:在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例可能性就越大.

(2)观测值法:通过2×2列联表,先计算K的观测值k,然后借助k的含义判断“两个分类变量有关系”这一结论成立的可信程度.

跟踪训练3 为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:

2

aa+b,也可cc+d.两个比例的值相差越大,X与Y有关系成立的

男生 女生 合计

喜爱打篮球 不喜爱打篮球 6 合计 48 10 2

已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.

3(1)请将上面的2×2列联表补充完整(不用写计算过程);

(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由;

2019年

(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值. 考点 独立性检验思想的应用

题点 分类变量与统计、概率的综合性问题 解 (1)列联表补充如下:

男生 女生 合计

48×?220-60?

(2)由K=≈4.286.

28×20×32×16

2

2

喜爱打篮球 22 10 32 不喜爱打篮球 6 10 16 合计 28 20 48 因为4.286>3.841,所以,能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关. (3)喜爱打篮球的女生人数X的可能取值为0,1,2. 其概率分别为 C109

P(X=0)=2=,

C2038C10C1010

P(X=1)=2=,

C2019C109

P(X=2)=2=,

C2038故X的分布列为

21

12

X P X的均值为E(X)=0++=1.

1091919

0 9 381 10 192 9 38

1.某机构调查中学生的近视情况,了解到某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A.平均数 B.方差 C.回归分析 D.独立性检验 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 D

2.对于分类变量X与Y的随机变量K的观测值k,下列说法正确的是( )

2

2019年

A.k越大,“X与Y有关系”的可信程度越小 B.k越小,“X与Y有关系”的可信程度越小 C.k越接近于0,“X与Y没有关系”的可信程度越小 D.k越大,“X与Y没有关系”的可信程度越大 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 B

解析 k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,k越小,“X与Y有关系”的可信程度越小.

3.用等高条形图粗略估计两个分类变量是否相关,观察下列各图,其中两个分类变量关系最强的是( )

考点 定性分析的两类方法 题点 利用图形定性分析 答案 D

解析 由等高条形图易知,D选项两个分类变量关系最强.

4.若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( ) A.100个吸烟者中至少有99人患有肺癌

B.1个人吸烟,那么这个人有99%的概率患有肺癌 C.在100个吸烟者中一定有患肺癌的人 D.在100个吸烟者中可能一个患肺癌的人也没有 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 D

解析 独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.

2019年

5.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据.

数学成绩好 数学成绩不好 总计

(1)计算a,b,c的值;

总成绩好 478 399 总成绩不好 总计 490 423 913 a 24 b c (2)文科学生总成绩不好与数学成绩不好有关系吗? 考点 独立性检验及其基本思想 题点 独立性检验的方法

解 (1)由478+a=490,得a=12. 由a+24=c,得c=12+24=36. 由b+c=913,得b=913-36=877. (2)计算随机变量K的观测值

913×?478×24-399×12?k=≈6.233>5.024,

490×423×877×36因为P(K≥5.024)≈0.025,

所以在犯错误的概率不超过0.025的前提下,认为文科学生总成绩不好与数学成绩不好有关系.

1.列联表与等高条形图

列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系. 2.对独立性检验思想的理解

独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K的值,如果K的值很大,说明假设不合理.K越大,两个分类变量有关系的可能性越大.

2

2

2

2

2

2

一、选择题

1.下面是一个2×2列联表:

x1 x2 总计

y1 a 8 y2 21 25 46 总计 73 33 106 b 2019年

则表中a,b的值分别为( ) A.94,96 C.52,60

考点 分类变量与列联表 题点 求列联表中的数据 答案 C

2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检B.52,50 D.54,52

验,经计算得K2

=7.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( ) A.0.1% B.1% C.99% D.99.9% 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 C

解析 易知K2

=7.01>6.635,对照临界值表知,有99%的把握认为喜欢乡村音乐与性别有关系.

3.在独立性检验中,两个分类变量“X与Y有关系”的可信度为99%,则随机变量K2

的观测值k的取值范围是( A.[3.841,5.024) B.[5.024,6.635) C.[6.635,7.879) D.[7.879,10.828)

考点 分类变量与列联表 题点 求观测值 答案 C

4.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:

优秀 及格 总计 甲班 11 34 45 乙班 8 37 45 总计 19 71 90

则随机变量K2

的观测值约为( ) A.0.600 B.0.828 C.2.712

D.6.004

考点 分类变量与列联表 题点 求观测值 答案 A

90×?11×37-34×8?2

解析 根据列联表中的数据,可得随机变量K2

的观测值k=45×45×19×71

≈0.600.故选A.

5.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为( )

)