高中数学苏教版 (2019)选择性必修第二册9.2独立性检验课后练习题
展开9.2独立性检验苏教版( 2019)高中数学选择性必修第二册
第I卷(选择题)
一、单选题(本大题共8小题,共40.0分。在每小题列出的选项中,选出符合题目的一项)
1. 假设有两个分类变量X和Y,其2×2列联表如下:
对于同一样本,以下数据能说明X和Y有关系的可能性最大的一组是( )
A. a=45,c=15 B. a=40,c=20
C. a=35,c=25 D. a=30,c=30
2. 在对人们的休闲方式的一次调查中,共调查了120人,其中女性65人,男性55人.女性中有40人主要的休闲方式是看电视,另外25人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外35人主要的休闲方式是运动.则认为性别与休闲方式有关系的把握大约为( )
A. 0.1 B. 0.01 C. 0.9 D. 0.99
3. 某校团委对“学生性别和喜欢某热门软件是否有关”作了一次调查,其中被调查的女生人数是男生人数的12,男生喜欢该软件的人数占男生人数的16,女生喜欢该软件的人数占女生人数的23.若有95%的把握认为是否喜欢该软件和性别有关,则男生至少有( )
P(χ2⩾k)
0.050
0.010
k
3.841
6.635
A. 12人 B. 6人 C. 10人 D. 18人
4. 某校对学生进行心理障碍测试,得到的数据如表
焦虑
说谎
懒惰
总计
女生
5
10
15
30
男生
20
10
50
80
总计
25
20
65
110
根据以上数据可判断在这三种心理障碍中,与性别关系最大的是( )
A. .焦虑 B. .说谎 C. 懒惰 D. .以上都不对
5. 某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
A. 成绩 B. 视力 C. 智商 D. 阅读量
6. 利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得K2≈7.245,参照下表:得到的正确结论是( )
P(K2⩾k0)
0.01
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
A. 有99%以上的把握认为“爱好该项运动与性别无关”
B. 有99%以上的把握认为“爱好该项运动与性别有关”
C. 在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”
D. 在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”
7. 为直观判断两个分类变量X和Y之间是否有关系,若它们的取值分别为{x1,x2}和{y1,y2},通过抽样得到如下表:
y1
y2
x1
a
c
x2
b
d
则下列哪两个比值相差越大,可判断两个分类变量之间的关系应该越强( )
A. ab+d与ba+c B. aa+b与cc+d C. ac+d与ba+b D. aa+d与bb+c
8. 2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
P(χ2⩾k)
0.1
0.05
0.01
0.001
k
2.706
3.841
6.635
10.828
A. 130 B. 190 C. 240 D. 250
二、多选题(本大题共4小题,共20.0分。在每小题有多项符合题目要求)
9. 为了增强学生的身体素质,提高适应自然环境、克服困难的能力,某校在课外活动中新增了一项登山活动,并对“学生喜欢登山和性别是否有关”做了一次调查,其中被调查的男女生人数相同,得到如图所示的等高条形统计图,则下列说法中正确的有( )
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
k
3.841
6.635
P(χ2⩾k)
0.050
0.010
A. 被调查的学生中喜欢登山的男生人数比喜欢登山的女生人数多
B. 被调查的女生中喜欢登山的人数比不喜欢登山的人数多
C. 若被调查的男女生均为100人,则有99%的把握认为喜欢登山和性别有关
D. 无论被调查的男女生人数为多少,都有99%的把握认为喜欢登山和性别有关
10. 在对吸烟与患肺病这两个分类变量的独立性检验中,下列说法正确的序号是(参考数据:pχ2⩾6.635=0.01)( )
A. 若χ2的观测值满足χ2≥6.635,我们有99%的把握认为吸烟与患肺病有关系.
B. 若χ2的观测值满足χ2≥6.635,那么在100个吸烟的人中约有99人患有肺病.
C. 从独立性检验可知,如果有99%的把握认为吸烟与患肺病有关系时,那么我们就认为:每个吸烟的人有99%的可能性会患肺病.
D. 从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误.
11. 在一次独立性检验中,判断两个分类变量A和B是否有关系,得出下表:
A
A
B
10
40
B
15
a
且最后发现,没有90%的把握认为两个分类变量A和B有关系,则a的值可以为( )
参考公式:随机变量χ2的观测值计算公式:χ2═n(ad−bc)2(a+b)(c+d)(a+c)(b+d)
临界值表:
P(χ2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A. 40 B. 30 C. 20 D. 10
12. 在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况,如下表所示:
则下列说法正确的是.( )
附:参考公式:χ2=n(ad−bc)2(a+c)(b+d)(a+b)(c+d),其中n=a+b+c+d.
独立性检验临界值表:
P(χ2≥k0)
0.10
0.05
0.025
0.010
k0
2.706
3.841
5.024
6.635
A. n11n1+>6n2+
B. χ2<2.706
C. 有90%的把握认为,在恶劣气候飞行中,晕机与否跟男女性别有关
D. 没有理由认为,在恶劣气候飞行中,晕机与否跟男女性别有关
第II卷(非选择题)
三、填空题(本大题共4小题,共20.0分)
13. 某足球联赛期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢甲队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据绘制成如下列联表:
年龄
是否喜欢甲队
合计
不喜欢甲队
喜欢甲队
高于40岁
p
q
50
不高于40岁
15
35
50
合计
a
b
100
若工作人员从调查的所有人中任取一人,取到喜欢甲队的人的概率为35,在犯错误的概率不超过 的前提下认为年龄与甲队的被喜欢程度有关.
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
P(χ2≥xα)
0.050
0.010
0.005
0.001
xα
3.841
6.635
7.879
10.828
14. 已知下列命题:
(1)在线性回归模型中,决定系数R2越接近于1,表示回归效果越好;
(2)两个变量相关性越强,则相关系数r就越接近于1;
(3)在回归直线方程y∧=-0.5x+2中,当解释变量x每增加一个单位时,预报变量y平均减少0.5个单位;
(4)两个模型中残差平方和越小的模型拟合的效果越好.
(5)回归直线y=bx+a恒过样本点的中心(x,y),且至少过一个样本点;
(6)若χ2⩾6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;
(7)从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.其中正确命题的序号是 .
15. 某市举行了首届阅读大会,为调查市民对阅读大会的满意度,相关部门随机抽取男女市民各50名,每位市民对大会给出满意或不满意的评价,得到下面列联表:
满意
不满意
男市民
60−m
m−10
女市民
m+10
40−m
当m≤25,m∈N*时,若没有95%的把握认为男、女市民对大会的评价有差异,则m的最小值为___________.
附:χ2=n(ad−bc)2a+bc+da+cb+d,其中n=a+b+c+d.
α=Pχ2≥k
0.10
0.05
0.005
k
2.706
3.841
7.879
16. (1)已知两个变量线性相关,若它们的相关性越强,则相关系数的绝对值越接近于1.
(2)正态曲线当μ一定时,σ越小,总体分布越集中,σ越大,总体分布越分散
(3)对于分类变量A与B的随机变量k2,k2越大说明“A与B有关系”的可信度越大.
(4)在刻画回归模型的拟合效果时,残差平方和越小,相关指数R2的值越大,说明拟合的效果越好.
(5)根据最小二乘法由一组样本点(xi,yi),求得的回归方程是y=bx+a,对所有的解释变量,bxi+a的值一定与yi有误差.以上命题正确的序号为____________.
四、解答题(本大题共6小题,共72.0分。解答应写出文字说明,证明过程或演算步骤)
17. (本小题12.0分)
中国棋手柯洁与AlphaGo的人机大战引发全民对围棋的关注,某学校社团为调查学生学习围棋的情况,随机抽取了100名学生进行调查,并根据调查结果绘制了学生日均学习围棋时间的频率分布直方图(如图所示),将日均学习围棋时间不低于40min的学生称为“围棋迷”.
(1)请根据已知条件完成下面2×2列联表,并判断是否有95%的把握认为“围棋迷”与性别有关;
非围棋迷
围棋迷
总计
男
女
10
55
总计
(2)为了进一步了解“围棋迷”的围棋水平,从“围棋迷”中按性别分层抽样抽取5名学生组队参加校际交流赛.首轮该校需派2名学生出赛,若从5名学生中随机抽取2人出赛,求2人恰好一男一女的概率.
附表:
P(χ2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)
18. (本小题12.0分)
某大学餐饮中心为了了解新生的饮食习惯,在某学院大一年级100名学生中进行了抽样调查,发现喜欢甜品的占70%.这100名学生中南方学生共80人,南方学生中有20人不喜欢甜品.
(1)完成下列2×2列联表:
喜欢甜品
不喜欢甜品
合计
南方学生
北方学生
合计
(2)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;
(3)已知在被调查的南方学生中有6名数学系的学生,其中2名不喜欢甜品;有5名物理系的学生,其中1名不喜欢甜品.现从这两个系的学生中,各随机抽取2人,记抽出的4人中不喜欢甜品的人数为X,求X的分布列和数学期望.
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
P(K2≥k0)
0.15
0.100
0.050
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
19. (本小题12.0分)
甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d).
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
20. (本小题12.0分)
为了研究注射某种抗病毒疫苗后是否产生抗体与某项指标值的相关性,研究人员从某地区10万人中随机抽取了200人,对其注射疫苗后的该项指标值进行测量,按0,20,20,40,40,60,60,80,80,100分组,得到该项指标值频率分布直方图如图所示.同时发现这200人中有120人在体内产生了抗体,其中该项指标值不小于60的有80人.
(1)填写下面的2×2列联表,判断是否有95%的把握认为“注射疫苗后产生抗体与指标值不小于60有关”.
指标值小于60
指标值不小于60
合计
有抗体
没有抗体
合计
(2)以注射疫苗后产生抗体的频率作为注射疫苗后产生抗体的概率,若从该地区注射疫苗的人群中随机抽取4人,求产生抗体的人数X的分布列及期望.
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
P(χ2⩾χ0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
χ0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
21. (本小题12.0分)
“五项管理”是“双减”工作的一项具体抓手,是促进学生身心健康、解决群众急难愁盼问题的重要举措.为了在“控量”的同时力求“增效”,提高作业质量,某学校计划设计差异化作业.因此该校对初三年级的400名学生每天完成作业所用时间进行统计,部分数据如下表:
男生
女生
总计
90分钟以上
80
x
180
90分钟以下
y
z
220
总计
160
240
400
(1)求x,y,z的值,并根据题中的列联表,判断是否有95%的把握认为完成作业所需时间在90分钟以上与性别有关?
(2)教务处从完成作业所需时间在90分钟以上的学生中用分层抽样的方法抽取9人了解情况,校长再从这9人中选取3人进行访谈,记校长选取的3人中男生人数为X,求X的分布列和数学期望.
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)
P(χ2⩾x0)
0.150
0.100
0.050
0.025
0.010
x0
2.072
2.076
3.841
5.024
6.635
22. (本小题12.0分)
某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300名学生每周平均体育运动时间的样本数据(单位:小时).
(I)应收集多少位女生的样本数据?
(II)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12]
估计该校学生每周平均体育运动时间超过4小时的概率;
(III)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”
P(χ2≥k0)
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
附:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d).
答案和解析
1.【答案】A
【解析】
【分析】
本题考查独立性检验,属于中档题.
【解答】
解:对于A选项,χ12=100×(4560−1040)(4555−1545)= 80033≈24.24;
对于B选项,χ22=100×(4060−1040)(4050−2050)= 503;
对于C选项,χ32=100×(3560−1040)(3545−2555)=3200297≈ 10.77;
对于D选项,χ42=100×(3060−1040)(3040−3060)=254.
由于χ12最大,故可以判断出,X和Y有关系的可能性最大.故选A.
2.【答案】D
【解析】
【分析】
本题考查2×2列联表,独立性检验,属于中档题.
【解答】
解:根据所给的数据得到2×2列联表,如下:
男
女
合计
看电视
20
40
60
运动
35
25
60
合计
55
65
120
计算χ2=120×(20×25−35×40)255×65×60×60≈7.552>6.635,所以有99%的把握认为性别与休闲方式有关系.故选D.
3.【答案】A
【解析】
【分析】
本题考查了独立性检验,为中档题.
【解答】
设男生人数为x,则女生人数为x2,则列联表如下:
喜欢
该软件
不喜欢
该软件
合计
男生
x6
5x6
x
女生
x3
x6
x2
合计
x2
x
3x2
若有95%的把握认为是否喜欢该软件和性别有关,则χ2≥ 3.841,
即χ2=3x2(x6⋅x6−5x6⋅x3)2x⋅x2⋅x2⋅x=3x8≥3.841,解得x> 10.24.
又因为x2,x3,x6,5x6为整数,所以男生至少有12人.故选A.
4.【答案】B
【解析】解:由题设表格可得到三个新的表格如下:
关于是否得到焦虑的结论:
焦虑
不焦虑
合计
女生
5
25
30
男生
20
60
80
合计
25
85
110
关于是否说谎的结论:
说谎
不说谎
合计
女生
10
20
30
男生
10
70
80
合计
20
90
110
关于是否懒惰的结论:
懒惰
不懒惰
合计
女生
15
15
30
男生
50
30
80
合计
65
90
110
对于三种心理障碍分别构造三个随机变量k1,k2,k3,
由表中数据得:
k1=110×(5×60−25×20)230×80×25×85≈0.863<2.706,
k2=110×(10×70−20×10)230×80×20×90≈6.366>5.024,
k3=110×(15×30−15×50)230×80×65×45≈1.410<2.706,
∴有97.5%的把握认为说谎与性别有关,没有充分数据显示焦虑和懒惰与性别有关,
这说明在这三种情理中心理障碍中说谎与性别关系最大.
故选:B.
由表中数据,将表分为焦虑,说谎和懒惰三个表格,分别求得观测值k12,k22,k32,同题目所提供观测值表进行检验,比较大小,即可判断在这三种心理障碍中说谎与性别关系最大.
本题考查与性别关系最大的心理障碍的判断,考查独立检验等基础知识,考查运算求解能力,是中档题.
5.【答案】D
【解析】
【分析】
本题考查独立性检验的应用,考查学生的计算能力,属于中档题.
根据表中数据,利用公式,求出χ2,即可得出结论.
【解答】
解:因为χ12=52×(6×22−14×10)216×36×32×20=52×8216×36×32×20,
χ22=52×(4×20−16×12)216×36×32×20=52×112216×36×32×20,
χ32=52×(8×24−12×8)216×36×32×20=52×96216×36×32×20,
χ42=52×(14×30−6×2)216×36×32×20=52×408216×36×32×20,
则有χ42>χ22>χ32>χ12,所以阅读量与性别关联的可能性最大.
故选:D.
6.【答案】B
【解析】
【分析】
本题考查了独立性检验的应用问题,是基础题.
根据题意参照临界值表即可得出正确的结论.
【解答】
解:独立性检验的方法计算得K2≈7.245,参照临界值表,得7.245>6.635,
所以有99%以上的把握认为“爱好该项运动与性别有关”.
故选B.
7.【答案】B
【解析】
【分析】
本题考查独立性检验,属于基础题.
利用独立性检验的计算公式即可加以判断.
【解答】
解:因为χ2=(a+b+c+d)(ad−bc)2(a+c)(b+d)(a+b)(c+d),所以当x2的值越小说明两个分类变量之间的有关系的把握程度越小,反之,当x2的值越大说明两个分类变量之间的有关系的把握程度越大,即两个分类变量之间的关系应该越强,aa+b−cc+d=ad−bc(a+b)(c+d)与x2的关系等价,则aa+b与cc+d的值相差越大,可判断两个分类变量之间的关系应该越强.
8.【答案】B
【解析】
【分析】
本题考查独立性检验,数学运算,属于基础题.结合题意列出2×2列联表,计算χ2,进一步结合选项进行求解即可.
【解答】
解:依题意.设男、女生的人数各为5x.建立2×2列联表如下所示:
喜欢网络课程
不喜欢网络课程
总计
男生
4x
x
5x
女生
3x
2x
5x
总计
7x
3x
10x
χ2=8x2−3x22·10x5x·5x·3x·7x=10x21,由题意可知6.635<10x21<10.828,所以139.335<10x<227.388.
故选B.
9.【答案】AC
【解析】
【分析】
本题主要考查了独立性检验的应用问题,以及考查了计算能力,是中档题.
【解答】
解:选项A,根据条形图,知喜欢登山的男生人数比喜欢登山的女生人数多,故选项A正确;
选项B,女生中喜欢登山的人数比不喜欢登山的人数少,故选项B错误;
选项C,若被调查的男女生均为100人,由条形图,列出列联表,
男
女
合计
喜欢
80
30
110
不喜欢
20
70
90
合计
100
100
200
χ2=200×80×70−30×202110×90×100×100=500099>6.635.
∴有99%的把握认为喜欢登山和性别有关,故选项C正确;
选项D,如果不确定参与调查的男女生人数,无法计算是否有99%的把握认为喜欢登山和性别有关,故选项D错误;
故答案选AC.
10.【答案】AD
【解析】
【分析】
本题的考点是独立性检验的应用,根据独立性检测考查两个变量是否有关系的方法进行判断,准确的理解判断方法及χ2的含义是解决本题的关键,属于中档题.
若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,表示有1%的可能性使推断出现错误,不表示有99%的可能患有肺病,也不表示在100个吸烟的人中必有99人患有肺病,故可得结论.
【解答】
解:若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,不表示有99%的可能患有肺病,故A正确;
不表示在100个吸烟的人中必有99人患有肺病,故B不正确;
不表示有每个吸烟的人有99%的可能性会患肺病,故C不正确;
从统计量中得知有99%的把握认为吸烟与患肺病有关系时,是指有1%的可能性使推断出现错误,D正确.
故选:AD.
11.【答案】AB
【解析】
【分析】
本题考查独立性检验,属于基础题,解题时,根据随机变量χ2的观测值计算公式,
得到χ2=(65+a)(10a−15×40)225×50×(40+a)(15+a),由于没有90%的把握认为两个分类变量A和B有关系,故χ2<2.706,代入各项值即可完成判断.
【解答】
解:χ2=(65+a)(10a−15×40)225×50×(40+a)(15+a)=2×(65+a)(a−60)225×(40+a)(15+a),
因为没有90%的把提认为两个分类变量A和B有关系,
所以χ2<2.706,代入验证可知a=40或a=30满足.
12.【答案】ABD
【解析】
【分析】
本题考查了独立性检验的基本思想,求列联表中参数值以及χ2的观测值,进而判断选项的正误,属于中档题.
解本题时,由列联表数据关系求出各参数值即可确定A得正误,根据χ2的参考公式求值,由χ2≈0.775<2.706结合临界值判定表知“没有理由认为,在恶劣气候飞行中,晕机与否跟男女性别有关”,由此可确定B、C、D的正误.
【解答】
解:由列联表数据得,n22=28−15=13,n2+=6+13=19,n1+=46−19=27,
n11=27−15=12,n+1=12+6=18.∴n11n1+=1227=49>6n2+=619,即A正确;
晕机
不晕机
合计
男
12
15
27
女
6
13
19
合计
18
28
46
∴χ2=46×(12×13−6×15)218×28×19×27≈0.775<2.706,即B正确;
且没有理由认为,在恶劣气候飞行中,晕机与否跟男女性别有关;即C错误;D正确.
故本题选:ABD.
13.【答案】0.05
【解析】
【分析】
本题考查了独立性检验和古典概型的计算,考察学生的数据分析能力与计算能力,属中档题.
由古典概型公式得q+35100=35,可得q、p、a、b,再由公式得出χ2,对照临界值表可得结论.
【解答】
解:设“从所有人中任意抽取一个,取到喜欢甲队的人”为事件A,
由已知得P(A)=q+35100=35,
所以q=25,p=25,a=40,b=60.
χ2=100×(25×35−25×15)240×60×50×50=256≈4.167>3.841.
故犯错误的概率不超过0.05的前提下认为年龄与甲队的被喜欢程度有关.
故答案为0.05
14.【答案】(1)(3)(4)(7)
【解析】
【分析】
本题考查回归分析及独立性检验,属于中档题.
根据题意,逐项进行判断即可.
【解答】
解:在线性回归模型中,决定系数 R2越接近于1,表示回归效果越好,故(1)正确;
两个变量相关性越强,则相关系数r的绝对值就越接近于1,故(2)错误;
(3)在回归直线方程y∧=-0.5x+2中,当解释变量x每增加一个单位时,预报变量y平均减少0.5个单位,正确;
两个模型中残差平方和越小的模型拟合的效果越好,故(4)正确;
回归直线y=bx+a恒过样本点的中心x,y,不一定过样本点,故(5)错误;
若 χ2⩾6.635,我们有99%的把握认为吸烟与患肺病有关系,并不能说在100个吸烟的人中必有99人患有肺病,故(6)错误;
从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误,故(7)正确.
综上正确的有(1)(3)(4)(7).
故答案为(1)(3)(4)(7).
15.【答案】21
【解析】
【分析】
本题考查独立性检验,属于中档题.
根据没有95%的把握认为男、女市民对大会的评价有差异,求出χ2关于m的表达式,从而可以通过解不等式得到m的取值范围,再加上m是正整数,从而可以得到答案.
【解答】
解:由题意可知,χ2=100[(60−m)(40−m)−(m−10)(m+10)]270×30×50×50=4(25−m)221,
由题意可知4(25−m)221<3.841,
整理得(25−m)2< 20.2,又m≤25,m∈N*,
所以m的最小值为21.
16.【答案】(1)(2)(3)(4)
【解析】
【分析】
本题利用命题真假的判断,考查了最小二乘法、相关系数、独立性检验、相关指数、正态分布等知识,属于中档题.
根据相关概念,逐项排除,即可求出结果.
【解答】
解:由相关性与相关系数的关系,可得若它们的相关性越强,
则相关系数的绝对值越接近于1,故(1)正确;
由正态分布的性质知μ一定,σ越小则波动越小总体分布越集中,σ越大总体越分散,
故(2)正确;
对分类变量A与B,它们的随机变量K2的观测值k越大,“A与B有关系”的把握程度越大,故(3)正确;
用相关指数R2来刻画回归效果,R2越大,说明模型的拟合效果越好,故(4)正确;
根据最小二乘法由一组样本点(xi,yi),求得的回归方程是y=bx+a,对所有的解释变量xi,bxi+a的值可能与yi有误差,只是一个预测值,故(5)错误.
即正确的有:(1)(2)(3)(4).
故答案为(1)(2)(3)(4).
17.【答案】解:(1)由频率分布直方图可知,(0.020+0.005)×10×100=25,
所以在抽取的100人中,“围棋迷”有25人,
从而2×2列联表如下:
非围棋迷
围棋迷
总计
男
30
15
45
女
45
10
55
总计
75
25
100
χ2=100×(30×10−15×45)245×55×75×25≈3.030.
因为3.030<3.841,
所以没有95%的把握认为“围棋迷”与性别有关.
(2)由(1)中列联表可知25名“围棋迷”中有男生15名,女生10名,
所以从“围棋迷”中按性别分层抽样抽取的5名学生中,有男生3名,记为B1,B2,B3,有女生2名,记为G1,G2.
则从5名学生中随机抽取2人出赛,基本事件有:(B1,B2),(B1,B3),(B1,G1),(B1,G2),(B2,B3),(B2,G1),(B2,G2),(B3,G1),(B3,G2),(G1,G2),共10种;
其中2人恰好一男一女的有:(B1,G1),(B1,G2),(B2,G1),(B2,G2),(B3,G1),(B3,G2),共6种.
故2人恰好一男一女的概率为P=610=35.
【解析】本题考查独立性检验,及古典概型,属于中档题.
(1)利用频率分布直方图求出列联表的值,再求出χ2,进而即可得结果;
(2)利用列举法,根据古典概型求概率即可.
18.【答案】解:(1)由题可知,喜欢甜品的人数为100×70%=70人,
完成2×2列联表如下:
喜欢甜品
不喜欢甜品
合计
南方学生
60
20
80
北方学生
10
10
20
合计
70
30
100
(2)由题意,K2=100×(60×10−20×10)270×30×80×20≈4.762>3.841,
∴有95%的把握认为“南方学生和北方学生在选甜品的饮食习惯方面有差异”.
(3)X的所有可能取值为0,1,2,3,
P(X=0)=C42C42C62C52=625,
P(X=1)=C42C41+C41C21C42C62C52=1225,
P(X=2)=C41C21C41+C22C42C62C52=1975,
P(X=3)=C22C41C62C52=275,
则X的分布列为
X
0
1
2
3
P
625
1225
1975
275
所以X的数学期望E(X)=0+1×1225+2×1975+3×275=1615.
【解析】本题考查独立性检验,考查离散型随机变量的分布列、数学期望的求法,考查排列组合等基础知识,考查运算求解能力,是中档题.
(1)由已知条件能完成2×2列联表;
(2)K2≈4.762>3.841,对比临界值表即可得结论;
(3)X的所有可能取值为0,1,2,3,分别求出相应的概率,由此能求出X的分布列和数学期望.
19.【答案】解:由题意,可得甲机床、乙机床生产总数均为200件,
因为甲的一级品的频数为150,所以甲的一级品的频率为150200=34;
因为乙的一级品的频数为120,所以乙的一级品的频率为120200=35;
(2)根据2×2列联表,可得χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)
=400(150×80−50×120)2270×130×200×200≈10.256>6.635.
所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.
【解析】本题考查了统计与概率中的独立性检验,属于基础题.
(1)根据表格中统计可知甲机床、乙机床生产总数和频数,再求出频率值即可;
(2)根据2×2列联表,求出χ2,再将χ2的值与6.635比较,即可得出结论.
20.【答案】解:(1)由频率分布直方图可知,
样本中指标值不小于60的人数为(0.025+0.005)×20×200=120,
标值小于60的人数为80,
2×2列联表如下:
指标值小于60
指标值不小于60
合计
有抗体
40
80
120
没有抗体
40
40
80
合计
80
120
200
χ2=200(40×40−40×80)280×120×80×120=509≈5.556>3.841,
所以有95%的把握认为“注射疫苗后人体产生抗体与指标值不小于60有关”;
(2)注射疫苗后产生抗体的概率p=120200=35,
由题可知,X~B(4,35),
∴P(X=k)=C4k(35)k(25)4−k(k=0,1,2,3,4)
X的分布列为:
X
0
1
2
3
4
P
16625
96625
216625
216625
81625
所以E(X)=np=4×35=2.4.
【解析】本题考查频率分布直方图、独立性检验、离散型随机变量及其分布列、离散型随机变量的期望与方差、n次独立重复试验与二项分布,属于中档题.
(1)根据频率分布直方图求出相关数据,完成列联表,求出χ2的值,即可求出结果;
(2)由题可知,X~B(4,35),求出X的值和相应的概率,即可求出结果.
21.【答案】解:(1)由80+x=180可得:x=100;
由80+y=160可得:y=80;
由80+z=220可得:z=140;
所以2×2列联表如下:
男生
女生
总计
90分钟以上
80
100
180
90分钟以下
80
140
220
总计
160
240
400
因为χ2=400(80×140−80×100)2180×220×160×240=800297≈2.694<3.841,
所以没有95%的把握认为完成作业所需时间在90分钟以上与性别有关.
(2)抽取的9人中,需要抽取男生:9180×80=4人,女生:9180×100=5人,
X取值0,1,2,3,
P(X=0)=C53C93=542,P(X=1)=C41C52C93=1021,
P(X=2)=C42C51C93=514,P(X=3)=C43C93=121
所以X的分布列为
X
0
1
2
3
P
542
1021
514
121
E(X)=0+1×1021+2×514+3×121=43.
【解析】本题考查了列联表与独立性检验的应用问题,考查离散型随机变量的分布列与数学期望计算,属于中档题.
(1)计算χ2,判断问题;
(2)X取值0,1,2,3,计算对应的概率即可.
22.【答案】解:(Ⅰ)300×450015000=90,∴应收集90位女生的样本数据;
(Ⅱ)由频率分布直方图可得1−2×(0.100+0.025)=0.75,
∴该校学生每周平均体育运动时间超过4小时的概率为0.75;
(Ⅲ)由(Ⅱ)知,300位学生中有300×0.75=225人每周平均体育运动时间超过4小时,
75人每周平均体育运动时间不超过4小时,
又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:
男生
女生
总计
每周平均体育运动时间不超过4小时
45
30
75
每周平均体育运动时间超过4小时
165
60
225
总计
210
90
300
∴χ2=300×(45×60−165×30)2210×90×75×225≈4.762>3.841,
∴有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
【解析】本题主要考查独立性检验,频率分布直方图,分层抽样等基础知识,考查运算求解能力以及应用意识,属于中档题.
(Ⅰ)根据15000人,其中男生10500人,女生4500人,可得应收集多少位女生的样本数据;
(Ⅱ)由频率分布直方图可得1−2×(0.100+0.025)=0.75,即可求出该校学生每周平均体育运动时间超过4小时的概率;
(Ⅲ)写出2×2列联表,求出χ2,与临界值比较,即可得出结论.
数学选择性必修第二册9.2独立性检验精品同步测试题: 这是一份数学选择性必修第二册9.2独立性检验精品同步测试题试卷主要包含了列联表,独立性检验等内容,欢迎下载使用。
高中苏教版 (2019)9.2独立性检验精品同步练习题: 这是一份高中苏教版 (2019)9.2独立性检验精品同步练习题,文件包含同步讲义苏教版2019高中数学选修第二册92独立性检验原卷版docx、同步讲义苏教版2019高中数学选修第二册92独立性检验解析版docx等2份试卷配套教学资源,其中试卷共53页, 欢迎下载使用。
高中数学苏教版 (2019)选择性必修第二册9.2独立性检验精品当堂达标检测题: 这是一份高中数学苏教版 (2019)选择性必修第二册9.2独立性检验精品当堂达标检测题,文件包含92独立性检验五大题型解析版docx、92独立性检验五大题型原卷版docx等2份试卷配套教学资源,其中试卷共52页, 欢迎下载使用。