2022届高考数学一轮复习单元检测十四 算法、统计与统计案例(解析版)
展开单元检测十四 算法、统计与统计案例
(时间:120分钟 满分:150分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(2021·唐山期末)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样的方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于( )
A.9 B.10 C.12 D.13
答案 D
解析 因为甲、乙、丙三个车间生产的产品件数分别是120,80,60,
所以甲、乙、丙三个车间生产的产品数量比为6∶4∶3,
丙车间生产产品所占的比例为,
因为样本中丙车间生产的产品有3件,占总产品的,
所以样本容量n=3÷=13.
2.(2021·上海普陀区模拟)若样本平均数为,总体平均数为μ,则( )
A.=μ B.≈μ
C.μ是的估计值 D.是μ的估计值
答案 D
解析 样本平均数为,总体平均数为μ,统计学中,利用样本数据估计总体数据,∴样本平均数是总体平均数μ的估计值.
3.为了普及环保知识,增强环保意识,某中学随机抽取30名学生参加环保知识竞赛,得分(10分制)的频数分布表如下表:
得分
3
4
5
6
7
8
9
10
频数
2
3
10
6
3
2
2
2
设得分的中位数为me,众数为m0,平均数为x,则( )
A.me=m0=x B.me=m0
解析 由表知,众数m0=5.
中位数是第15个数与第16个数的平均值,
由表知将数据从小到大排列第15 个数是5,第16个数是6,
所以中位数me==5.5,
平均数是x=×(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈6.
所以m0
A.中位数 B.方差 C.众数 D.平均数
答案 A
解析 由于总共有30个人,且他们的分数互不相同,选15位同学进入下一轮比赛,第15名和第16名的成绩的平均数是中位数,要判断是否进入下一轮比赛,故应知道自己的分数与中位数的大小.
5.孙子定理在世界古代数学史上具有相当高的地位,它给出了寻找共同余数的整数问题的一般解法.下图是某同学为寻找共同余数为2的整数n而设计的程序框图,若执行该程序框图,则输出的结果为( )
A.29 B.30 C.31 D.32
答案 D
解析 ,为整数,则n除以3,5的余数均为2,n>25,n=32.
6.根据最小二乘法由一组样本点(xi,yi)(其中i=1,2,…,300),求得的线性回归方程是=x+,则下列说法正确的是( )
A.至少有一个样本点落在回归直线=x+上
B.若所有样本点都在回归直线=x+上,则变量间的相关系数为1
C.对所有的解释变量xi(i=1,2,…,300),xi+的值一定与yi有误差
D.若回归直线=x+的斜率>0,则变量x与y正相关
答案 D
解析 回归直线必过样本数据中心点,但样本点可能全部不在回归直线上,故A错误;所有样本点都在回归直线=x+上,则变量间的相关系数为±1,故B错误;若所有的样本点都在回归直线=x+上,则x+的值与yi相等,故C错误;相关系数r与符号相同,若回归直线=x+的斜率>0,则r>0,样本点分布应从左到右是上升的,则变量x与y正相关,故D正确.
7.某学校在校学生2 000人,为了学生的“德、智、体”全面发展,学校举行了跑步和登山比赛活动,每人都参加而且只参与其中一项比赛,各年级参与比赛的人数情况如下表:
高一年级
高二年级
高三年级
跑步人数
a
b
c
登山人数
x
y
z
其中a∶b∶c=2∶5∶3,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高三年级参与跑步的学生中应抽取( )
A.15人 B.30人 C.40人 D.45人
答案 D
解析 全校参与登山的人数是2 000×=500,所以参与跑步的人数是1 500,样本中参与跑步的人数为×200=150,又a∶b∶c=2∶5∶3,故高三年级参与跑步的学生中应抽取150×=45(人).
8.(2020·东莞期末)今年6月初,某市采取了鼓励地摊经济的做法,该市各区的地摊的摊位数和食品摊位比例分别如图1、图2所示,现用分层抽样的方法抽取5%的摊位进行调查,则抽取的样本容量与A区被抽取的食品摊位数分别为( )
A.210,24 B.210,50
C.1 500,24 D.1 500,50
答案 A
解析 样本容量为(1 000+800+1 000+1 400)×5%=210,
A区被抽取的食品摊位数为1 000×0.48×5%=24.
9.某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是( )
A.12 B.13 C.14 D.15
答案 C
解析 由题可知,第一、二、三、四、五组的频率分别为0.16,0.4,0.32,0.08,0.04.
因为前三组的频率和为0.88,
故要使90%的患者显现出明显病状,
则需隔离观察的天数至少是13+=14.
10.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.1
0.05
0.01
0.001
k0
2.706
3.841
6.635
10.828
A.130 B.190 C.240 D.250
答案 B
解析 依题意,设男、女生的人数都为5x,则男、女学生总数量为10x,
建立2×2列联表如下所示:
喜欢网络课程
不喜欢网络课程
总计
男生
4x
x
5x
女生
3x
2x
5x
总计
7x
3x
10x
故K2==,
由题可知6.635<<10.828,
所以139.335<10x<227.388.只有B符合题意.
11.执行如图所示的程序框图,则输出的S的值为( )
A. B. C.2 D.2-1
答案 A
解析 由题意可知,当1≤k≤2 019时,不断执行循环结构,累加求和,可得
S=1+++…+.
当k=2 020时,跳出循环.
所以输出
S=1+++…+
=1+-1+-+…+-
=.
12.2020年是5G的爆发之年,5月中国信通院发布了2020年4月国内手机市场运行分析报告,该报告统计了从2019年7月到2020年4月这十个月国内手机市场总出货量与国内5G手机出货量占同期手机出货量比重变化情况(简称市场占比),得到下面两个统计图:
则下列描述不正确的是( )
A.2020年4月国内5G手机出货量是这十个月中的最大值
B.从2019年7月到2020年2月,国内5G手机出货量保持稳定增长
C.相比2020年前4个月,2019年下半年的国内手机市场总出货量相对稳定
D.2019年12月到2020年1月国内5G手机市场占比的增长率比2020年1月到2月的增长率大
答案 B
解析 由柱状图可以看出2020年4月的出货量最高,故A正确;由柱状图可以看出从2019年7月至2020年2月,国内5G手机出货量有增有降,不是保持稳定增长,故B不正确;由柱状图可以看出2019年下半年的手机出货量相对稳定,而在2020年的前4个月中,手机的出货量波动较大,故C正确;2019年12月到2020年1月国内5G手机市场占比的增长率为×100%≈47.8%,2020年1月到2月的增长率为×100%≈41.8%,所以2019年12月到2020年1月国内5G手机市场占比的增长率比2020年1月到2月的增长率大,故D正确.
二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中横线上)
13.某次调查的200个数据的频率分布直方图如图所示,则在[50,70)内的数据大约有_________个.
答案 140
解析 [50,70)的频率为(0.03+0.04)×10=0.7,
故在[50,70)内的频数为0.7×200=140.
14.已知一组数据4,a,7,5,8的平均数为6,则该组数据的标准差是________.
答案
解析 由平均数公式=6,得a=6,
所以s=
=.
15.某产品的宣传费用x(万元)与销售额y(万元)的统计数据如下表所示:
宣传费用x(万元)
4
2
3
5
销售额y(万元)
45
24
a
50
根据上表可得线性回归方程=9.6x+2.9,则宣传费用为3万元时,对应的销售额a为________.
答案 27
解析 线性回归方程=9.6x+2.9,
=(4+2+3+5)=3.5,
由回归方程过点(,),故=36.5,
即=(45+24+a+50)=36.5,解得a=27.
16.在发生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.过去10日,A,B,C,D四地新增疑似病例数据信息如下:
A地:中位数为2,极差为5;
B地:总体平均数为2,众数为2;
C地:总体平均数为1,总体方差大于0;
D地:总体平均数为2,总体方差为3.
则以上四地中,一定符合没有发生大规模群体感染标志的是________(填A,B,C,D).
答案 AD
解析 对于A地,因为中位数为2,极差为5,所以最大值为2+5=7,满足每天新增疑似病例不超过7人,故A地符合;对于B地,若过去10日分别为0,0,0,2,2,2,2,2,2,8,满足总体平均数为2,众数为2,但不满足每天新增疑似病例不超过7人,故B地不符合;对于C地,若过去10日分别为0,0,0,0,0,0,0,0,1,9,满足总体平均数为1,总体方差大于0,但不满足每天新增疑似病例不超过7人,故C地不符合;对于D地,假设至少有一天疑似病例超过7人,设为8人,则方差为=[(8-2)2+…]>×(8-2)2=3.6>3,与题中条件总体方差为3矛盾,故假设不成立.故满足每天新增疑似病例不超过7人,故D地符合.
三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(10分)2020年,新冠病毒在世界肆虐,造成很多行业前景不如从前,国家最近调查了A,B,C三类工种的复工情况,在调查的所有职工中,A工种占40%,B工种占50%,C工种占10%.现用分层抽样的方法从调查的全体职工中抽取一个容量为n的样本.试确定:
(1)若n=200,则在A工种、B工种、C工种中分别应抽取多少人?
(2)若抽取的A工种比C工种多30人,则抽取的B工种有多少人?
解 (1)A工种应抽取的人数为200×40%=80,
B工种应抽取的人数为200×50%=100,
C工种应抽取的人数为200×10%=20.
(2)若抽取的A工种比C工种多30人,
则40%n-10%n=30,解得n=100.
故抽取的B工种有50%n=100×50%=50(人).
18.(12分)某市民用水拟实行阶梯水价,每人用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.
解 (1)由用水量的频率分布直方图知,
该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
组号
1
2
3
4
5
6
7
8
分组
[2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,17]
(17,22]
(22,27]
频率
0.1
0.15
0.2
0.25
0.15
0.05
0.05
0.05
根据题意,该市居民该月的人均水费估计为
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).
19.(12分)在某校举行的航天知识竞赛中,参与竞赛的女生与男生人数之比为1∶3,且成绩分布在[40,100],分数在80分以上(含80分)的同学获奖.按男女生用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图如图所示.
(1)求a的值,并计算所抽取样本的平均值(同一组中的数据用该组区间的中点值作代表);
(2)填写下面的2×2列联表,是否有95%的把握认为“获奖与学生的性别有关”?
女生
男生
总计
获奖
5
不获奖
总计
200
参考公式和数据:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.10
0.05
0.01
0.005
0.001
k0
2.706
3.841
6.635
7.879
10.828
解 (1)a=×[1-(0.01+0.015+0.03+0.015+0.005)×10]=0.025,=45×0.1+55×0.15+65×0.25+75×0.3+85×0.15+95×0.05=69.
(2)2×2列联表如下:
女生
男生
总计
获奖
5
35
40
不获奖
45
115
160
总计
50
150
200
因为K2=≈4.167>3.841,因此有95%的把握认为“获奖与学生的性别有关”.
20.(12分)二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:
使用年数x
2
3
4
5
6
7
售价y
20
12
8
6.4
4.4
3
z=ln y
3.00
2.48
2.08
1.86
1.48
1.10
下面是z关于x的折线图:
(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用样本相关系数加以说明;
(2)求y关于x的非线性回归方程,并预测当某辆A型号二手车使用年数为9年时售价约为多少;(,小数点后保留两位有效数字)
(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的非线性回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年.
参考公式:==,
=-,r=.
参考数据:
iyi=187.4,izi=47.64,=139,
=4.18,=13.96,
=1.53,ln 1.46≈0.38,ln 0.711 8≈-0.34.
解 (1)由题意,知=×(2+3+4+5+6+7)=4.5,
=×(3+2.48+2.08+1.86+1.48+1.10)=2,
又izi=47.64,=4.18,
=1.53,
∴r==-≈-0.99,
∴z与x的相关系数大约为-0.99,说明z与x的线性相关程度很高.
(2)==-≈-0.36,
∴=- ≈2+0.36×4.5=3.62,
∴z与x的线性回归方程是=-0.36x+3.62,
又z=ln y,
∴y关于x的非线性回归方程是=e-0.36x+3.62.
令x=9,得=e-0.36×9+3.62=e0.38,
∵ln 1.46≈0.38,∴≈1.46.
即预测当某辆A型号二手车使用年数为9年时售价约为1.46万元.
(3)当≥0.711 8时,
即e-0.36x+3.62≥0.711 8=eln 0.711 8≈e-0.34,
则有-0.36x+3.62≥-0.34,解得x≤11,
因此,预测在收购该型号二手车时车辆的使用年数不得超过11年.
21.(12分)(2021·南通启东中学月考)某市为了考察本地区芯片生产企业的生产能力,在一家生产芯片的企业中抽取了100名员工的日产量进行分析,整理后画出频率分布直方图,如图所示,
(1)求a的值,并求[120,130)这一组的频数;
(2)估计该企业员工的日平均产量及方差(同一组中的数据用该组区间的中点值作代表);
(3)估计该企业员工生产芯片日产量在145只以上的百分比.
解 (1)在频率分布直方图中,矩形面积之和为1,
所以(0.005+2a+0.015+0.020+0.040)×10=1,
故a=0.010.
[120,130)这一组的频数为0.015×10×100=15.
(2)由此算得平均数约为
105×0.05+115×0.1+125×0.15+135×0.4+145×0.2+155×0.1=134,
方差为(105-134)2×0.05+(115-134)2×0.1+(125-134)2×0.15+(135-134)2×0.4+(145-134)2×0.2+(155-134)2×0.1=159.
估计该企业员工的日平均产量约为134只,方差约为159.
(3)区间[140,150),组中值为145,
可估计日产量在145只以上的频率为
[(0.02×0.5)+0.01]×10=0.2,
故估计该企业员工生产芯片日产量在145只以上的百分比为20%.
22.(12分)(2020·德州宁津县第一中学期末)随着贸易战的不断升级,越来越多的国内科技巨头加大了科技研发投入的力度.中华技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入x(亿元)与科技升级直接收益y(亿元)的数据统计如下:
序号
1
2
3
4
5
6
7
8
9
10
11
12
x
2
3
4
6
8
10
13
21
22
23
24
25
y
13
22
31
42
50
56
58
68.5
68
67.5
66
66
当0
(1)根据下列表格中的数据,比较当0
模型①
模型②
回归方程
=4.1x+11.8
=21.3-14.4
(yi-i)2
182.4
79.2
(附:刻画回归效果的相关指数R2=,≈4.1)
(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,比较科技升级投入17亿元与20亿元时公司实际收益的大小.
(附:用最小二乘法求线性回归方程=x+的系数:
= =,=-)
(3)科技升级后,“麒麟”芯片的效率X大幅提高,经实际试验得X大致服从正态分布N(0.52,0.012).公司对科技升级团队的奖励方案如下:若芯片的效率不超过50%,不予奖励;若芯片的效率超过50%,但不超过53%,每部芯片奖励2元;若芯片的效率超过53%,每部芯片奖励4元,记Y为每部芯片获得的奖励,求E(Y)(精确到0.01).
(附:若随机变量X~N(σ>0),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5)
解 (1)由表格中的数据,182.4>79.2,
所以,
所以.
可见模型①的相关指数R小于模型②的相关指数R.
所以回归模型②的拟合效果更好.
所以当x=17时,科技升级直接收益的预测值为
=21.3×-14.4≈21.3×4.1-14.4=72.93(亿元).
(2)当x>17时,
由已知可得==23.
==67.2.
所以=+0.7=67.2+0.7×23=83.3.
所以当x>17时,y与x满足的线性回归方程为
=-0.7x+83.3.
当x=20时,科技升级直接收益的预测值为=-0.7×20+83.3=69.3(亿元).
当x=20时,实际收益的预测值为69.3+5=74.3亿元>72.93亿元,
所以技术升级投入20亿元时,公司的实际收益更大.
(3)因为μ-2σ=0.50,μ+σ=0.53,所以
P(0.50
P(X>0.53)=P(X>μ+σ)=.
所以E(Y)=0+2×0.818 6+4×=2.271 8≈2.27(元).
高考数学一轮复习单元质检十算法初步统计与统计案例含解析新人教A版理: 这是一份高考数学一轮复习单元质检十算法初步统计与统计案例含解析新人教A版理,共10页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
高考数学一轮复习单元质检十算法初步统计与统计案例含解析新人教A版文: 这是一份高考数学一轮复习单元质检十算法初步统计与统计案例含解析新人教A版文,共9页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
广西专用高考数学一轮复习单元质检十算法初步统计与统计案例含解析: 这是一份广西专用高考数学一轮复习单元质检十算法初步统计与统计案例含解析,共11页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。