- 高考专题15 数列解答题 试卷 4 次下载
- 高考专题14 数列选择填空 试卷 3 次下载
- 高考专题12 概率与统计选择填空 试卷 2 次下载
- 高考专题11 立体几何解答题 试卷 4 次下载
- 2022年新高考地区名校高三数学一模好题分类汇编专题10 立体几何选择填空 试卷 2 次下载
高考专题13 概率与统计解答题
展开2022年新高考地区名校高三数学一模好题分类汇编
专题13 概率与统计解答题
一、解答题
1.(2022·河北唐山·高三期末)某统计部门依据《中国统计年鉴——2017》提供的数据,对我国1997-2016年的国内生产总值(GDP)进行统计研究,作出了两张散点图:图1表示1997-2016年我国的国内生产总值(GDP),图2表示2007-2016年我国的国内生产总值(GDP).
(1)用表示第i张图中的年份与GDP的线性相关系数,,依据散点图的特征分别写出的结果;
(2)分别用线性回归模型和指数回归模型对两张散点图进行回归拟合,分别计算出统计数据——相关指数的数值,部分结果如下表所示:
年份
1997-2016
2007-2016
线性回归模型
0.9306
指数回归模型
0.9899
0.978
①将上表中的数据补充完整(结果保留3位小数,直接写在答题卡上);
②若估计2017年的GDP,结合数据说明采用哪张图中的哪种回归模型会更精准一些?若按此回归模型来估计,2020年的GDP能否突破100万亿元?事实上,2020年的GDP刚好突破了100万亿元,估计与事实是否吻合?结合散点图解释说明.
【答案】(1),
(2)①0.996,②不吻合,理由见解析.
【解析】
【分析】
(1)观察两图,根据的范围,我们只需要确定哪个图像关联系数更高,即选择较大的那个相关系数;
(2)第一小问可根据第(1)问中确定的的值,通过来计算;第二小问可通过计算出来的数据跟已有的数据对比,选出最适合模拟最近的年份的回归模型,并且按照这个回归模型来模拟,预测2020年是否能够突破100万亿,并且根据回归模型的增长趋势来判断.
(1)
由散点图可知,图2拟合效果更好、相关系数较大,所以,.
(2)
①0.996
②由图2中的线性回归模型得到的相关指数为0.996,是所有回归模型的相关指数中数值最大的,而且2017年是最近的年份,因此选择图2中的线性回归模型来估计2017年的GDP,是比较精准的.
按照图2中的线性回归模型来估计(延长回归直线可发现),2020年不能突破100万亿元.
估计与事实不吻合.综合两张图来考虑,我国的GDP随年份的增长整体上呈现指数增长的趋势,而且2020年比2016年又多发展了4年,指数回归趋于明显,因此,按照线性回归模型得到的估计值与实际数据有偏差、不吻合,属于正常现象.
2.(2022·河北保定·高三期末)某车间打算购买2台设备,该设备有一个易损零件,在购买设备时可以额外购买这种易损零件作为备件,价格为每个100元.在设备使用期间,零件损坏,备件不足再临时购买该零件,价格为每个300元.在使用期间,每台设备需要更换的零件个数的分布列为
5
6
7
.
表示2台设备使用期间需更换的零件数,代表购买2台设备的同时购买易损零件的个数.
(1)求的分布列;
(2)以购买易损零件所需费用的期望为决策依据,试问在和中,应选哪一个?
【答案】(1)答案见解析;
(2)应选择.
【解析】
【分析】
(1)由每台设备需更换零件个数的分布列求出的所有可能值,并求出对应的概率即可得解.
(2)分别求出和时购买零件所需费用的期望,比较大小即可作答.
(1)
的可能取值为10,11,12,13,14,
,,
,,
,
则的分布列为:
10
11
12
13
14
0.09
0.3
0.37
0.2
0.04
(2)
记为当时购买零件所需费用,
,,
,,
元,
记为当时购买零件所需费用,
,,
,
元,显然,
所以应选择.
3.(2022·河北张家口·高三期末)已知某区、两所初级中学的初一年级在校学生人数之比为,该区教育局为了解双减政策的落实情况,用分层抽样的方法在、两校初一年级在校学生中共抽取了名学生,调查了他们课下做作业的时间,并根据调查结果绘制了如下频率分布直方图:
(1)在抽取的名学生中,、两所学校各抽取的人数是多少?
(2)该区教育局想了解学生做作业时间的平均时长(同一组中的数据用该组区间的中点值作代表)和做作业时长超过小时的学生比例,请根据频率分布直方图,估计这两个数值;
(3)另据调查,这人中做作业时间超过小时的人中的人来自中学,根据已知条件填写下面列联表,并根据列联表判断是否有的把握认为“做作业时间超过小时”与“学校”有关?
做作业时间超过小时
做作业时间不超过小时
合计
校
校
合计
附表:
附:.
【答案】(1)、两校所抽取人数分别为、;
(2)估计该区学生做作业时间的平均时长为小时,该区有的学生做作业时长超过小时;
(3)列联表答案见解析,有的把握认为“做作业时间超过小时”与“学校”有关.
【解析】
【分析】
(1)设、两校所抽取人数分别为、,根据已知条件列出关于、的方程组,解出这两个量的值,即可得解;
(2)将频率分布直方图中每个矩形底边的中点值乘以对应矩形的面积,可得出该区学生做作业时间的平均时长,计算出频率直方图中后三个矩形的面积之和,可得出该地区做作业时长超过小时的学生比例;
(3)根据题中信息完善列联表,计算出的观测值,结合临界值表可得出结论.
(1)
解:设、两校所抽取人数分别为、,由已知可得,解得.
(2)
解:由直方图可知,学生做作业的平均时长的估计值为
(小时).
由,可知有的学生做作业时长超过小时.
综上,估计该区学生做作业时间的平均时长为小时,该区有的学生做作业时长超过3小时.
(3)
解:由(2)可知,有(人)做作业时间超过3小时.
故填表如下(单位:人):
做作业时间超过小时
做作业时间不超过小时
合计
校
校
合计
,
所以有的把握认为“做作业时间超过小时”与“学校”有关.
4.(2022·河北深州市中学高三期末)2018年9月,台风“山竹”在我国多个省市登陆,造成直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的数据分成五组:,,,,(单位:元),得到如图所示的频率分布直方图.
(1)试根据频率分布直方图估计该地区每个农户的平均损失(同一组中的数据用该组区间的中点值代表);
(2)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户并且损失超过4000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8000元的农户数为,求的分布列和数学期望.
【答案】(1)3360元;(2)见解析
【解析】
【分析】
(1)根据频率分布直方图计算每个农户的平均损失;
(2)根据频率分布直方图计算随机变量X的可能取值,再求X的分布列和数学期望值.
【详解】
(1)记每个农户的平均损失为元,则
;
(2)由频率分布直方图,可得损失超过1000元的农户共有(0.00009+0.00003+0.00003)×2000×50=15(户),损失超过8000元的农户共有0.00003×2000×50=3(户),
随机抽取2户,则X的可能取值为0,1,2;
计算P(X=0)==,
P(X=1)==,
P(X=2)==,
所以X的分布列为;
X
0
1
2
P
数学期望为E(X)=0×+1×+2×=.
【点睛】
本题考查了频率分布直方图与离散型随机变量的分布列与数学期望计算问题,属于中档题.
5.(2022·山东省淄博实验中学高三期末)唐三彩是中国古代陶瓷烧制工艺的珍品,它吸取了中国国画、雕塑等工艺美术的特点,在中国文化中占有重要的历史地位,在陶瓷史上留下了浓墨重彩的一笔,唐三彩的生产至今已有多年的历史,制作工艺十分复杂,而且优质品检验异常严格,检验方案是:先从烧制的这批唐三彩中任取件作检验,这件唐三彩中优质品的件数记为,如果,再从这批唐三彩中任取件作检验,若都为优质品,则这批唐三彩通过检验:如果,再从这批唐三彩中任取件作检验,若为优质品,则这批唐三彩通过检验,其他情况下,这批唐三彩的优质品概率为,即取出的每件唐三彩是优质品的概率都为,且各件唐三彩是否为优质品相互独立.
(1)求这批唐三彩通过优质品检验的概率;
(2)已知每件唐三彩的检验费用为元,且抽取的每件唐三彩都需要检验,对这批唐三彩作质量检验所需的总费用记为元,求的分布列及数学期望.
【答案】(1);
(2)分布列见解析,.
【解析】
【分析】
(1)由题意可知,所求事件包含两种情况:①第一次取出的件有件优质品,第二次取出的件全为优质品;②第一次取出的件全是优质品,第二次取出的件为优质品.利用独立事件和互斥事件的概率公式可求得所求事件的概率;
(2)分析可知随机变量可能的取值为、、,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,进一步可求得的值.
(1)
解:设第一次取出的件唐三彩中恰有件优质品为事件,
第一次取出的件唐三彩全是优质品为事件,
第二次取出的件唐三彩都是优质品为事件,
第二次取出的件唐三彩是优质品为事件,这批唐三彩通过检验为事件,
依题意有,
所以.
(2)
解:可能的取值为、、,
,
,.
所以的分布列为
.
6.(2022·山东青岛·高三期末)习近平总书记在党的十九大报告中指出,保障和改善人民最关心最直接最现实的利益问题要从“让人民群众满意的事情”做起.2021年底某市城市公园建设基本完成,为了解市民对该项目的满意度,从该市随机抽取若干市民对该项目进行评分(满分100分),绘制成如图所示的频率分布直方图,并将分数从低到高分为四个等级:
满意度评分
低于60分
60分到79分
80分到89分
不低于90分
满意度等级
不满意
基本满意
满意
非常满意
(1)若市民的满意度评分相互独立,以满意度样本估计全市民满意度,现从全市民中随机抽取5人,求至少2人非常满意的概率;
(2)相关部门对该项目进行验收,验收的硬性指标是:全民对该项目的满意指数不低于0.8,否则该项目需要进行整改,根据你所学的统计知识,判断该项目能否通过验收,并说明理由;(注:满意指数=)
(3)在等级为不满意的市民中,老人占,现从该等级市民中按年龄分层抽取9人了解不满意的原因,并从中选取3人担任督导员.记X为老年督导员的人数,求X的分布列及数学期望E(X).
【答案】(1);
(2)能通过验收,理由见解析;
(3)的分布列见解析,.
【解析】
【分析】
(1)根据矩形面积之和为1求出a,然后通过对立事件求概率的方法与二项分布求概率的方法求出答案;
(2)算出满意度的平均分即可判断答案;
(3)根据超几何分布求概率方法求出概率,然后列出分布列,求出期望.
(1)
,解得,设至少2人非常满意的概率为事件A,由题意知5人中非常满意的人数,.
(2)
由频率分布直方图得:
满意度平均分为,满意指数,因此,能通过验收.
(3)
分层抽取9人中老人有3人,由题意知服从超几何分布,的可能取值为,,,,,则分布列为:
0
1
2
3
所以,.
7.(2022·山东青岛·高三期末)法国数学家庞加莱是个喜欢吃面包的人,他每天都会到同一家面包店购买一个面包.该面包店的面包师声称自己所出售的面包的平均质量是1000,上下浮动不超过50.这句话用数学语言来表达就是:每个面包的质量服从期望为1000,标准差为50的正态分布.
(1)已知如下结论:若,从的取值中随机抽取个数据,记这个数据的平均值为,则随机变量.利用该结论解决下面问题.
(i)假设面包师的说法是真实的,随机购买25个面包,记随机购买25个面包的平均值为,求;
(ii)庞加莱每天都会将买来的面包称重并记录,25天后,得到的数据都落在上,并经计算25个面包质量的平均值为.庞加莱通过分析举报了该面包师,从概率角度说明庞加莱举报该面包师的理由;
(2)假设有两箱面包(面包除颜色外,其他都一样),已知第一箱中共装有6个面包,其中黑色面包有2个;第二箱中共装有8个面包,其中黑色面包有3个.现随机挑选一箱,然后从该箱中随机取出2个面包.求取出黑色面包个数的分布列及数学期望.
附:
①随机变量服从正态分布,则,;
②通常把发生概率小于的事件称为小概率事件,小概率事件基本不会发生.
【答案】(1)(i);(ii)理由见解析.
(2)
0
1
2
【解析】
【分析】
(1)(i)由正太分布的对称性及原则进行求解;(ii)结合第一问求解的概率及小概率事件进行说明;(2)设取出黑色面包个数为随机变量,则的可能取值为0,1,2,求出相应的概率,进而求出分布列及数学期望.
(1)
(i)因为,所以,因为,所以,因为,所以;
(ii)由第一问知,庞加莱计算25个面包质量的平均值为,,而,为小概率事件,小概率事件基本不会发生,这就是庞加莱举报该面包师的理由;
(2)
设取出黑色面包个数为随机变量,则的可能取值为0,1,2,
则;,,故分布列为:
0
1
2
其中数学期望
8.(2022·山东日照·高三期末)2021年某出版社对投稿某期刊的600篇文章进行评选,每篇文章送3位专家进行评议,3位专家中有2位以上(含2位)专家评议意见为“不合格”的文章,将认定为“不入围文章”,有且只有1位专家评议意见为“不合格”的文章,将再送 2 位专家进行复评,2位复评专家中有1位以上(含1位)专家评议意见为“不合格”的文章,将认定为“不入围文章”.设每篇文章被每位专家评议为“不合格”的概率均为,且各篇文章是否被评议为“不合格”相互独立.
(1)记一篇参评的文章被认定为“不入围文章”的概率为,求;
(2)若拟定每篇文章需要复评的评审费用为1500元,不需要复评的评审费用为900元;除评审费外,其他费用总计为10万元.该出版社总预算费用为80万元,现以此方案实施,问是否会超过预算? 并说明理由.
【答案】(1);
(2)不会超过预算,理由见解析.
【解析】
【分析】
(1)一篇参评的文章被认定为“不入围文章”分为两种情况,①初评被认定为“不入围文章”,②复评的文章被认定为“不入围文章”.两种情况的概率相加即可求出;
(2)先求出一篇文章评审费用为1500元的概率,再求出一篇文章评审费用为900元的概率,进而求出评审一篇文章的平均费用的最大值,再求出600篇文章总费用的最大值,即可说明不会超过预算.
(1)
因为一篇文章初评被认定为“不入围文章”的概率为,一篇文章复评后被认定为“不入围文章”的概率为,
所以一篇参评的文章被认定为“不入围文章”的概率
+;
(2)
设每篇文章的评审费用为元,则的可能取值为.
,..
令.
当时,在上单调递增,当时,在上单调递减,
的最大值为,实施此方案,最高费用为:(万元).
因此实施此方案,不会超过预算.
9.(2022·山东莱西·高三期末)现有混在一起质地均匀且粗细相同的长度分别为1、2、3的钢管各3根(每根钢管附有不同的编号),现随机抽取4根(假设各钢管被抽取的可能性是相等的),再将抽取的这4根首尾相接焊成笔直的一根.
(1)记事件“抽取的4根钢管中恰有2根长度相同”,求;
(2)若用表示新焊成的钢管的长度(焊接误差不计),,,求的分布列和实数的取值范围.
【答案】(1)
(2)分布列见解析;
【解析】
【分析】
(1)由古典概型概率计算公式给求出;
(2)ξ可能的取值为,分别求出相应的概率,由此能求出ξ的分布列及E(ξ),再根据列不等式计算即可.
(1)
由已知;
(2)
由已知可能的取值有,
则,
,
,
,
的分布列为
5
6
7
8
9
10
11
,
,
解得
10.(2022·山东淄博·高三期末)学习强国中有两项竞赛答题活动,一项为“双人对战”,另一项为“四人赛”.活动规则如下:一天内参与“双人对战”活动,仅首局比赛可获得积分,获胜得2分,失败得1分;一天内参与“四人赛”活动,仅前两局比赛可获得积分,首局获胜得3分,次局获胜得2分,失败均得1分.已知李明参加“双人对战”活动时,每局比赛获胜的概率为;参加“四人赛”活动(每天两局)时,第一局和第二局比赛获胜的概率分别为p,.李明周一到周五每天都参加了“双人对战”活动和“四人赛”活动(每天两局),各局比赛互不影响.
(1)求李明这5天参加“双人对战”活动的总得分X的分布列和数学期望;
(2)设李明在这5天的“四人赛”活动(每天两局)中,恰有3天每天得分不低于3分的概率为.求p为何值时,取得最大值.
【答案】(1)分布列见解析,(分)
(2)
【解析】
【分析】
(1)可取5,6,7,8,9,10,求出对应随机变量的概率,从而可求出分布列,再根据期望公式求出数学期望即可;
(2)先求出一天得分不低于3分的概率,再求出恰有3天每天得分不低于3分的概率为,再根据导出求出函数的单调区间,即可得出答案.
(1)
解:可取5,6,7,8,9,10,
,,
,,
,,
分布列如下:
5
6
7
8
9
10
所以(分);
(2)
解:设一天得分不低于3分为事件,
则,
则恰有3天每天得分不低于3分的概率,
则
,
当时,,当时,,
所以函数在上递增,在上递减,
所以当时,取得最大值.
11.(2022·山东济南·高三期末)某机构为了解市民对交通的满意度,随机抽取了100位市民进行调查结果如下:回答“满意”的人数占总人数的一半,在回答“满意”的人中,“上班族”的人数是“非上班族”人数的;在回答“不满意”的人中,“非上班族”占.
(1)请根据以上数据填写下面列联表,并依据小概率值的独立性检验,分析能否认为市民对于交通的满意度与是否为上班族存关联?
满意
不满意
合计
上班族
非上班族
合计
(2)为了改善市民对交通状况的满意度,机构欲随机抽取部分市民做进一步调查.规定:抽样的次数不超过,若随机抽取的市民属于不满意群体,则抽样结束;若随机抽取的市民属于满意群体,则继续抽样,直到抽到不满意市民或抽样次数达到时,抽样结束.
(i)若,写出的分布列和数学期望;
(ii)请写出的数学期望的表达式(不需证明),根据你的理解说明的数学期望的实际意义.
附:
参考公式:,其中.
【答案】(1)列联表见解析,市民对交通的满意度与是否上班有关,此推断犯错误的概率不大于0.001
(2)(i)分布列见解析,;(ii),平均每抽取2个人,就会有一个不满意的市民
【解析】
【分析】
(1)根据题意完成列联表,进而利用公式计算可得,查表分析可得结果;
(2)(i)由(1)可知市民的满意度和不满意度均为,计算可得的分布列和数学期望,(ⅱ)由(i)可得,当n趋向于正无穷大时,趋向于2,即可理解为平均每抽取2个人,就会有一个不满意的市民.
(1)
由题意可知
满意
不满意
合计
上班族
15
40
55
非上班族
35
10
45
合计
50
50
100
零假设为:市民对交通的满意度与是否上班独立,
因为;
根据小概率值的独立性检验,我们推断不成立,即认为市民对交通的满意度与是否上班有关,此推断犯错误的概率不大于0.001.
(2)
(i)当时,的取值为1,2,3,4,5,
由(1)可知市民的满意度和不满意度均为;
所以,,,,,
所以的分布列为
1
2
3
4
5
P
所以;
(ⅱ)
当n趋向于正无穷大时,趋向于2,此时恰好为不满意度的倒数;
也可以理解为平均每抽取2个人,就会有一个不满意的市民.
12.(2022·山东临沂·高三期末)一机床生产了个汽车零件,其中有个一等品、个合格品、个次品,从中随机地抽出个零件作为样本.用表示样本中一等品的个数.
(1)若有放回地抽取,求的分布列;
(2)若不放回地抽取,用样本中一等品的比例去估计总体中一等品的比例.
①求误差不超过的的值;
②求误差不超过的概率(结果不用计算,用式子表示即可)
【答案】(1)分布列答案见解析;(2)①或;②.
【解析】
【分析】
(1)分析可知,利用二项分布可得出随机变量的分布列;
(2)①分析可知样本中一等品的比例为,可得出关于的不等式,即可得出的取值;
②根据超几何的概率公式可求得结果.
【详解】
(1)对于有放回抽取,每次抽到一等品的概率为,且各次试验之间的结果是独立的,
因此,从而,,,,,
所以的分布列如下:
(2)对于不放回抽取,各次试验结果不独立,服从超几何分布,样本中一等品的比例为,而总体中一等品的比例为,由题意,
①或;
②.
13.(2022·湖北襄阳·高三期末)2021年11月25日,南非报告发现新冠病毒突变毒株.1.1.529,26日,世界卫生组织将其命名为“奥密克戎”.传染病专家威兰德根据现有数据计算称,相比原始新冠毒株,“奥密克戎”的传染性高出5倍,而“德尔塔”仅高出70%.在最近的中非合作论坛上,中国正式宣布将再次向非洲援助冠状病毒疫苗10亿针.同时,卫生部拟从5名防疫专家中抽选人员分批次参与援助南非活动.援助活动共分3批次进行,每次援助需要同时派送2名专家,且每次派送专家均从这5人中随机抽选.已知这5名防疫专家中,2人有援非经验,3人没有援非经验.
(1)求5名防疫专家中的“甲”,在这3批次援非活动中恰有两次被抽选到的概率;
(2)求第一次抽取到没有援非经验专家的人数的分布列与期望.
【答案】(1);
(2)分布列见解析;期望为.
【解析】
【分析】
(1)由题可得甲在每轮抽取中,被抽取到的概率,然后利用独立重复实验概率公式即得;
(2)由题知的可能取0,1,2.然后根据分布列的步骤及期望公式即得.
(1)
由题可知5名防疫专家中的“甲”在每轮抽取中,被抽取到的概率为,
则三次抽取中,“甲”恰有两次被抽取到的概率为;
(2)
由题可知的可能取值有0,1,2.
;;.
所以分布列为:
0
1
2
0.1
0.6
0.3
所以的期望.
14.(2022·湖北武昌·高三期末)武汉热干面既是中国四大名面之一,也是湖北武汉最出名的小吃之一.某热干面店铺连续10天的销售情况如下(单位:份):
天数
1
2
3
4
5
6
7
8
9
10
套餐一
120
100
140
140
120
70
150
120
110
130
套餐二
80
90
90
60
50
90
70
80
90
100
(1)分别求套餐一、套餐二的均值、方差,并判断两种套餐销售的稳定情况;
(2)假定在连续10天中每位顾客只购买了一份,根据图表内容填写下列列联表,并据此判断能否有95%的把握认定顾客性别与套餐选择有关?
顾客套餐
套餐一
套餐二
合计
男顾客
400
女顾客
500
合计
附:
0.10
0.05
0.025
0.010
2.706
3.841
5.024
6.635
【答案】(1)套餐一:均值120,方差480;套餐二:均值80,方差220;套餐二销量相对稳定
(2)填表见解析;没有
【解析】
【分析】
(1)直接由公式分别求出套餐一、套餐二的均值、方差,从而判断其稳定性.
(2)由题意先完善列联表,再求出,从而得出结论.
(1)
套餐一:均值
方差;
套餐二:均值
方差.
因为,所以,套餐二销量相对稳定.
(2)
列联表如下:
顾客套餐
套餐一
套餐二
合计
男顾客
400
300
700
女顾客
800
500
1300
合计
1200
800
2000
因为,
所以,没有95%以上的把握认定顾客性别与套餐选有关.
15.(2022·湖北·恩施土家族苗族高中高三期末)为保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设某高校为了解全校学生的阅读情况,随机调查了200名学生的每周阅读时间x(单位:小时)并绘制如图所示的频率分布直方图:
(1)求这200名学生每周阅读时间的样本平均数和样本方差(同一组的数据用该组区间中点值代表);
(2)由直方图可以看出,目前该校学生每周的阅读时间x大致服从正态分布,其中近似为样本平均数,近似为样本方差.
①一般正态分布的概率都可以转化为标准正态分布的概率进行计算:若,令,则,且利用直方图得到的正态分布,求;
②从该高校的学生中随机抽取20名,记Z表示这20名学生中每周阅读时间超过10小时的人数,求Z的均值.
参考数据:,若,则.
【答案】(1),;
(2)①;②.
【解析】
【分析】
(1)利用频率分布直方图计算平均数和方差的方法直接计算作答.
(2)①利用给定公式直接计算;②利用①的结论结合二项分布的期望公式计算作答.
(1)
根据频率分布直方图知,阅读时间在区间
内的频率分别为,
,
,
所以样本平均数和样本方差分别为9,1.78.
(2)
①由题意知,,则有,
,,
②由①知,可得,
所以Z的均值.
16.(2022·湖北江岸·高三期末)5G网络是第五代移动通信网络的简称,是新一轮科技革命最具代表性的技术之一.2020年初以来,我国5G网络正在大面积铺开.A市某调查机构为了解市民对该市5G网络服务质量的满意程度,从使用了5G手机的市民中随机选取了200人进行问卷调查,并将这200人根据其满意度得分分成以下6组:、、、…,,统计结果如图所示:
(1)由直方图可认为A市市民对5G网络满意度得分Z(单位:分)近似地服从正态分布,其中近似为样本平均数,近似为样本的标准差s,并已求得.若A市恰有2万名5G手机用户,试估计这些5G手机用户中满意度得分位于区间的人数(每组数据以区间的中点值为代表);
(2)该调查机构为参与本次调查的5G手机用户举行了抽奖活动,每人最多有3轮抽奖活动,每一轮抽奖相互独立,中奖率均为.每一轮抽奖,奖金为100元话费且继续参加下一轮抽奖;若未中奖,则抽奖活动结束.现小王参与了此次抽奖活动,求小王所获话费总额X的数学期望.
参考数据:若随机变量Z服从正态分布,即,则,.
【答案】(1)(人)
(2)(元)
【解析】
【分析】
(1)根据正态分布所提供的数据计算即可;
(2)先得X的可能取值,再求概率,然后用数学期望公式计算即可.
(1)
由题意知样本平均数为,
∴,∵,所以,,
而
故2万名5H手机用户中满意度得分位于区间的人数约为(人)
(2)
由题意可知X的可能取值有0、100、200、300,
∴(元)
17.(2022·湖北省鄂州高中高三期末)中国载人航天工程办公室发布消息,为发挥中国空间站的综合效益,中国首个太空科普教育品牌“天宫课堂”正式推出.中国空间站首次太空授课活动于2021年12月9日面向全球进行直播.为了了解学生对此次直播课的观看情况,现从高三某班随机选取10名学生进行调查,发现有6名学生观看了直播,4名学生未观看直播.
(1)若从这10名学生中任选2名学生,求至多有1名学生未观看直播的概率;
(2)若从这10名学生中任选3名学生,记其中观看了直播的学生人数为,求的分布列和数学期望.
【答案】(1)
(2)分布列见解析,
【解析】
【分析】
(1)任选2名学生,至多有1名学生未观看直播包括这2名学生都观看直播和恰好有1人观看直播两种情况,根据古典概率公式可得答案.
(2)由题意可取0,1,2,3,分别求出其概率,可得分布列,由期望公式可得数学期望.
(1)
设“从10名学生中任选2名学生,至多有1名学生未观看直播”为事件,
.
(2)
由题意可知可取0,1,2,3
,,,,
【点睛】
.
18.(2022·湖北·高三期末)由文化和旅游部会同国家体育总局共同编制的《滑雪旅游度假地等级划分》(以下简称《标准》)日前发布实施.《标准》的发布得到旅游业界的广泛关注,将有力推动我国冰雪旅游高质量发展,助力北京2022年冬奥会举办.为推广滑雪运动,某滑雪场开展滑雪促销活动.促销期间滑雪场的收费标准是:
滑雪时间x小时
收费标准
免费
80元/人
120元/人
不足1小时的部分按1小时计算.有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为,;1小时以上且不超过2小时离开的概率分别为,,两人滑雪时间都不会超过3小时.
(1)求甲、乙两人所付的滑雪费用相同的概率;
(2)设甲、乙两人所付的滑雪费用之和为随机变量X,求N的分布列和期望(结果用分数表示).
【答案】(1)
(2)分布列见解析;期望为元
【解析】
【分析】
(1)两人付相同费用可分为三个互斥事件,而每一个事件发生的概率又由独立事件同时发生的概率乘法公式算出,最后再将三个互斥事件分别发生的概率相加即可;
(2)将两人所付的滑雪费用之和一一列出,再利用加法(互斥事件)和乘法(独立事件同时发生)公式计算出每一个随机变量的概率,列出分布列,并用期望公式计算出结果即可.
(1)
(1)两人所付费用相同,相同的费用可能为0、80、120元,
两人都付0元的概率为;
两人都付80元的概率为;
两人都付120元的概率为.
则两人所付费用相同的概率为;
(2)
(2)设甲、乙所付费用之和为X,X可能取值为0、80、120、160、200,240
则
所以,随机变量X的分布列为:
X
0
80
120
160
200
240
P
元.
19.(2022·湖北·黄石市有色第一中学高三期末)某种项目的射击比赛,开始时选手在距离目标处射击,若命中则记3分,且停止射击.若第一次射击未命中,可以进行第二次射击,但需在距离目标处,这时命中目标记2分,且停止射击.若第二次仍未命中,还可以进行第三次射击,此时需在距离目标处,若第三次命中则记1分,并停止射击.若三次都未命中则记0分,并停止射击.已知选手甲的命中率与目标的距离的平方成反比,他在处击中目标的概率为,且各次射击都相互独立.
(1)求选手甲在射击中得0分的概率;
(2)设选手甲在比赛中的得分为,求的分布列和数学期望.
【答案】(1)
(2)分布列见解析,
【解析】
【分析】
(1)先由在100m处击中目标的概率为求出,进而求出,,再利用相互独立事件同时发生的概率进行求解;
(2)先写出的可能取值,求出每个变量的概率,列表得到分布列,再利用期望公式进行求解.
(1)
解:记选手甲第一、二、三次射击命中目标分别为
事件、、,三次都没有击中目标为事件,则.
设选手甲在m处击中目标的概率为,则.
由m时,得,
所以,,
所以,.
由于各次射击都是相互独立的,所以选手甲在射击中得0分的概率为
.
(2)
解:由题设知,的可能取值为0,1,2,3.
,,
,.
则的分布列为
0
1
2
3
所以数学期望为.
20.(2022·湖南常德·高三期末)已知某箱中装有10件产品,其中合格品8件,次品2件.现进行产品质量检测,从中任取一件产品进行检测视为1次质量检测(如果取到合格品,则把它放回箱中;如果取到次品,则不放回箱中且另补放一件合格品到箱中).在重复n次这样的质量检测后,记箱中的次品件数为.
(1)求的分布列及数学期望;
(2)设表示“n次操作后箱中的次品件数为1”的概率,求,并用表示.
【答案】(1)分布列见解析,1.62
(2),
【解析】
【分析】
(1)由题可知,的可能取值为0,1,2,再分别计算出各取值对应的概率,得到分布列,即可求出数学期望;
(2)根据 “3次操作后箱中的次品件数为1”可知,可能是2次操作后箱中的次品件数为1,第三次取到合格品,也可能是第一次,第二次取到合格品,第三次取到次品,即可求出;根据全概率公式即可用表示出.
(1)
依题可知,的可能取值为0,1,2
,,
的分布列为
0
1
2
P
数学期望
(2)
;
记“n次质量检测后中的次品件数为1”为事件A,“n次质量检测后中的次品件数为2”为事件B,“第n+1次质量检测取到合格品”为事件C,“第n+1次质量检测取到次品”为事件D.
则
,
,,
∴.
21.(2022·湖南娄底·高三期末)某机构对于某地区的户家庭中的年可支配收入的调查中,获得如下的统计数据:的家庭将年可支配收入购买银行结构性存款,的家庭将年可支配收入存入银行,其余家庭将年可支配收入用于风险投资.又已知银行结构性存款获得的年收益率为的概率为,获得的年收益率为的概率为,存入银行的年收益率为,风险投资的平均收益率为,以下把频率当概率.假设该地区的每个家庭的年可支配收入为万元.
(1)求家庭的可支配收入不存入银行的概率;
(2)设年可支配收入为万元获得的年收益为,求的分布列和数学期望.
【答案】(1);
(2)分布列见解析,(万元).
【解析】
【分析】
(1)利用对立事件的概率公式可求得所求事件的概率;
(2)计算出随机变量的可能取值,列举出随机变量的分布列,进一步可计算得出的值.
(1)
解:由已知得,家庭的可支配收入不存入银行的概率为.
(2)
解:由已知得,的值分别为,,,
所以的分布列为:
所以数学期望为(万元).
22.(2022·湖南郴州·高三期末)2021年东京奥运会,中国举重代表队共10人,其中主教练、教练各1人,参赛选手8人,赛后结果7金1银,在全世界面前展现了真正的中国力量;举重比赛根据体重进行分级,某次举重比赛中,男子举重按运动员体重分为下列十级:
级别
54公斤级
59公斤级
64公斤级
70公斤级
76公斤级
体重
级别
83公斤级
91公斤级
99公斤级
108公斤级
108公斤级以上
体重
每个级别的比赛分为抓举与挺举两个部分,最后综合两部分的成绩得出总成绩,所举重量最大者获胜,在该次举重比赛中,获得金牌的运动员的体重以及举重成绩如下表
体重
54
59
64
70
76
83
91
99
106
举重成绩
291
304
337
353
363
389
406
421
430
(1)根据表中的数据,求出运动员举重成绩与运动员的体重的回归直线方程(保留1位小数);
(2)某金牌运动员抓举成绩为180公斤,挺举成绩为218公斤,则该运动员最有可能是参加的哪个级别的举重?
(3)凯旋回国后,中央一台记者从团队的10人中随机抽取3人进行访谈,用表示抽取到的是金牌得主的人数,求的概率分布列与数学期望.
参考数据:;
参考公式:.
【答案】(1)
(2)参加的应该是91公斤级举重
(3)分布列见解析;期望为
【解析】
【分析】
(1)依题意,计算出,由公式求得,由此求得回归方程.
(2)根据回归方程得:,解之可判断.
(3)随机变量的取值为0,1,2,3,求出对应概率,列出分布列,利用期望公式即可得解.
(1)
依题意,,
,
,则,
故回归方程为:;
(2)
该运动员的抓举和挺举的总成绩为398公斤,
根据回归方程可知:,解得,
即该运动员的体重应该在90公斤左右,即参加的应该是91公斤级举重;
(3)
随机变量的取值为0,1,2,3.则
,,
,,
所以随机变量的概率分布列为:
0
1
2
3
所以随机变量的数学期望为.
23.(2022·广东揭阳·高三期末)在高考结束后,省考试院会根据所有考生的成绩划分出特控线和本科线.考生们可以将自己的成绩与划线的对比作为高考志愿填报的决策依据.每一个学科的评价都有一个标准进行判断.以数学学科为例,在一次考试中,将考生的成绩由高到低排列,分为一、二、三档,前定为一档,前到前定为二档,后定为三档.在一次全市的模拟考试中,考生数学成绩的频率分布直方图如图所示,根据直方图的信息可知第三档的分数段为.
(1)求成绩位于时所对应的频率,并估计第二档和第一档的分数段;
(2)在历年的统计中发现,数学成绩为一档的考生其总分过特控线的概率为,数学成绩为二档的考生其总分过特控线的概率为,数学成绩为三档的考生其总分过特控线的概率为.在此次模拟考试中,甲、乙、丙三位考生的数学成绩分别为.请结合第(1)问中的分数段,求这三位考生总分上特控线的人数的分布列及数学期望.
【答案】(1),第一档的分数段为,第二档的分数段为
(2)
的分布列为:
0
1
2
3
数学期望为
【解析】
【分析】
(1)根据小矩形面积之和为1,求出成绩在所对应的频率为,结合题干条件求出一档、二档的分数段;(2)判断出甲乙丙的成绩属于哪一档,进而求出的可能取值,求出相应的概率,得到分布列,并求出期望值.
(1)
根据频率分布直方图的信息,成绩在,对应的频率分别为.
根据总的频率和为1,可得成绩在所对应的频率为.
,且,可知成绩在内的前也属于第一档.即可知第一档的分数段为,0.58=0.06+0.24+0.28且,故成绩在第内的后也属于第二档,所以二档的分数段为
(2)
根据第(1)问的结论可知,甲的成绩属于第三档,乙的成绩属于第二档,丙的成绩属于第一档.则的所有可能取值为
其中
则的分布列为:
0
1
2
3
的数学期望为:.
24.(2022·广东潮州·高三期末)甲、乙两所学校之间进行排球比赛,采用五局三胜制(先赢3局的学校获胜,比赛结束),约定比赛规则如下:先进行男生排球比赛,共比赛两局,后进行女生排球比赛,直到分出胜负.按照以往比赛经验,在男生排球比赛中,每局甲校获胜的概率为,乙校获胜的概率为,在女生排球比赛中,每局甲校获胜的概率为,乙校获胜的概率为,每局比赛结果相互独立.
(1)求甲校以3:1获胜的概率;
(2)记比赛结束时女生比赛的局数为,求的分布列及期望.
【答案】(1)
(2)分布列见解析,
【解析】
【分析】
(1)甲校以获胜的情况有:①前两局男排比赛中甲全胜,第三局比赛中甲负,第四局比赛甲胜,②前两局男排比赛中甲1胜1负,第三局比赛中甲胜,第四局比赛甲胜,由此能求出甲校以获胜的概率;
(2)记比赛结束时女生比赛的局数为,则的可能取值为1,2,3,分别求出相应的概率,由此能求出的概率分布及期望.
(1)
解:甲校以获胜的情况有:
①前两局男排比赛中甲全胜,第三局比赛中甲负,第四局比赛甲胜,概率为:
,
②前两局男排比赛中甲1胜1负,第三局比赛中甲胜,第四局比赛甲胜,概率为:
,
甲校以获胜的概率为:;
(2)
解:记比赛结束时女生比赛的局数为,则的可能取值为1,2,3,
,
,
,
的概率分布为:
1
2
3
所以.
25.(2022·广东东莞·高三期末)已知某次比赛的乒乓球团体赛采用五场三胜制,第一场为双打,后面的四场为单打.团体赛在比赛之前抽签确定主客队.主队三名选手的一单、二单、三单分别为选手、、,客队三名选手的一单、二单、三单分别为选手、、.比赛规则如下:第一场为双打(对阵)、第二场为单打(对阵)、第三场为单打(对阵)、第四场为单打(对阵)、第五场为单打(对阵).已知双打比赛中获胜的概率是,单打比赛中、、分别对阵、、时,、、获胜的概率如下表:
选手
选手
(1)求主、客队分出胜负时恰进行了3场比赛的概率;
(2)客队输掉双打比赛后,能否通过临时调整选手为三单、选手为二单使得客队团体赛获胜的概率增大?请说明理由.
【答案】(1)
(2)能通过临时调整选手为三单、选手为二单使得客队团体赛获胜的概率增大,理由见解析
【解析】
【分析】
(1)由“主、客队分出胜负时恰进行了3场比赛”的事件包含“主队3场全胜”和“客队3场全胜”两类事件求解;
(2)剩余四场比赛未调整Y、Z出场顺序的胜负情况分别为:胜胜胜、胜负胜胜、胜胜负胜、负胜胜胜,求得其概率;剩余四场比赛调整Y、Z出场顺序的胜负情况分别为:胜胜胜、胜负胜胜、胜胜负胜、负胜胜胜,求得其概率,比较即可.
(1)
解:设“主、客队分出胜负时恰进行了3场比赛”事件为事件A,
则事件A包含“主队3场全胜”和“客队3场全胜”两类事件,
“主队3场全胜”的概率为,
“客队3场全胜”的概率为,
所以,
所以主、客队分出胜负时恰进行了3场比赛的概率为.
(2)
能,理由如下:
设“剩余四场比赛未调整Y、Z出场顺序,客队获胜”为事件M,第二场单打(X对阵A)、第三场单打(Z对阵C)、第四场单打(Y对阵A)、第五场单打(X对阵B)的胜负情况分别为:胜胜胜、胜负胜胜、胜胜负胜、负胜胜胜;
则,
设“剩余四场比赛调整Y、Z出场顺序,客队获胜”为事件N,第二场单打(X对阵A)、第三场单打(Y对阵C)、第四场单打(Z对阵A)、第五场单打(X对阵B)的胜负情况分别为:胜胜胜、胜负胜胜、胜胜负胜、负胜胜胜;
则,
因为,
所以客队调整选手Y为三单、选手Z为二单获胜的概率更大.
26.(2022·广东罗湖·高三期末)已知甲、乙、丙三个研究项目的成员人数分别为20,15,10.现采用分层抽样的方法从中抽取9人,进行睡眠时间的调查.
(1)应从甲、乙、丙三个研究项目的成员中分别抽取多少人?
(2)若抽出的9人中有4人睡眠不足,5人睡眠充足,现从这9人中随机抽取3人做进一步的访谈调研,若随机变量X表示抽取的3人中睡眠充足的成员人数,求X的分布列与数学期望.
【答案】(1)分别抽取人,人,人
(2)分布列见解析,
【解析】
【分析】
(1) 甲、乙、丙三个研究项目的成员人数之比为,利用分层抽样的方法,即可求得从甲、乙、丙三个研究项目的员工人数;
(2)由题意,随机变量的所有可能取值为,求得相应的概率,得出其分布列,利用期望的公式,即可求解.
(1)
由已知,甲、乙、丙三个研究项目的成员人数之比为,
∴应从甲、乙、丙三个研究项目的成员中分别抽取的人数为,,,
∴,解得,
∴应从甲、乙、丙三个研究项目的成员中分别抽取人,人,人;
(2)
随机变量的所有可能取值为,
则,,
,,
∴随机变量的分布列为
随机变量的数学期望.
27.(2022·广东清远·高三期末)某市为积极响应上级部门的号召,通过沿街电子屏、微信公众号等各种渠道对抗疫进行了深入的宣传,帮助全体市民深入了解新型冠状病毒,增强战胜疫情的信心.为了检验大家对新型冠状病毒及防控知识的了解程度,该市推出了相关的问卷调查,随机抽取了年龄在18~99岁之间的200人进行调查,把年龄在和内的人分别称为“青年人”和“中老年人”.经统计,“青年人”和“中老年人”的人数之比为2∶3,其中“青年人”中有50%的人对防控的相关知识了解全面,“中老年人”中对防控的相关知识了解全面和了解不全面的人数之比是2∶1.
(1)根据已知条件,完成下面的列联表,并根据统计结果判断是否有95%的把握认为“中老年人”比“青年人”更加了解防控的相关知识.
了解全面
了解不全面
合计
青年人
中老年人
合计
(2)用频率估计概率从该市18~99岁市民中随机抽取3位市民,记抽出的市民对防控相关知识了解全面的人数为X,求随机变量X的分布列与数学期望.
附表及公式:,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)表格见解析,有
(2)分布列见解析,
【解析】
【分析】
(1)分别求出“青年人”中、“中老年人”中了解全面和了解不全面的人数,填入列联表即可,根据公式求出,然后对照临界值表即可得出结论;
(2)求出随机抽取1人抽到的市民对防控相关知识了解全面的概率,随机变量服从二项分布,写出随机变量,求出对于的概率,从而可得出分别列,即可求出期望.
(1)
解:(1)因为“青年人”和“中老年人”的人数之比为2∶3,所以“青年人”和“中老年人”的人数分别为80和120,
因为“青年人”中有50%的人对防控的相关知识了解全面,所以“青年人”中对防控的相关知识了解全面的有40人,了解不全面的有40人,
因为“中老年人”中对防控的相关知识了解全面和了解不全面的人数之比是2∶1,所以“中老年人”中对防控的相关知识了解不全面的有80人,了解不全面的有40人,
列联表如下:
了解全面
了解不全面
合计
青年人
40
40
80
中老年人
80
40
120
合计
120
80
200
因为,
所以有95%的把握认为“中老年人”比“青年人”更加了解防控的相关知识;
(2)
解:用样本估计总体可知,从该市18~99岁市民中随机抽取1人,抽到的市民对防控相关知识了解全面的概率为,
所以随机变量,
随机变量可取,
因为,
,
所以X的分布列为
X
0
1
2
3
P
.
28.(2022·广东汕尾·高三期末)书籍是精神世界的人口,阅读让精神世界闪光,阅读已成为中学生的一种生活习惯,每年4月23日为世界读书日.某研究机构为了解某地中学生的阅读情况,通过随机抽样调查了n名中学生,对这些人每周的平均阅读时间(单位:小时)进行统计,并将样本数据分成[0,2),[2,4),[4,6),[6,8),[8,10),[10,12),[12,14),[14,16),[16,18]九组,绘制成如图所示的频率分布直方图.已知这n名中学生中每周平均间读时间不低于16小时的人数是2人.
(1)求n和a的值;
(2)为进一步了解这n名中生数字媒体读时间和纸质图书阅读时间的分配情况,从周平均时间在[8,10),[10,12),[12,14)三组内的学生中,采用分层抽样的方法抽取了6人,现从这6人中随机抽取3人,记周平均阅读时间在[10,12)内的中学生人数为X,求X的分布列和数学期望.
【答案】(1)100,0.10
(2)分布列见解析,期望为1
【解析】
【分析】
(1)根据总数等于频数除频率,即可求得总数n,根据频率和为1,可求得a值.
(2)根据三组内的中学生人数比为,可求得6人中周平均阅读时间在内的中学生人数为2人,可得X的可能取值,分别求得各个取值对应的概率,列出分布列,代入公式,即可得期望.
(1)
由题意得
.
(2)
依题意,周平均阅读时间在三组内的中学生人数比为,
则6人中周平均阅读时间在内的中学生人数为2人
X的所有可能取值为0,1,2
,,
所以X的分布列为
X
0
1
2
P
数学期望为
29.(2022·广东佛山·高三期末)某财经杂志发起一项调查,旨在预测中国经济前景,随机访问了位业内人士,根据被访问者的问卷得分(满分分)将经济前景预期划分为三个等级(悲观、尚可、乐观).分级标准及这位被访问者得分频数分布情况如下:
经济前景等级
悲观
尚可
乐观
问卷得分
1
2
3
4
5
6
7
8
9
10
频数
2
3
5
10
19
24
17
9
7
4
假设被访问的每个人独立完成问卷(互不影响),根据经验,这位人士的意见即可代表业内人士意见,且他们预测各等级的频率可估计未来经济各等级发生的可能性.
(1)该杂志记者又随机访问了两名业内人士,试估计至少有一人预测中国经济前景为“乐观”的概率;
(2)某人有一笔资金,现有两个备选的投资意向:物联网项目或人工智能项目,两种投资项目的年回报率都与中国经济前景等级有关,根据经验,大致关系如下(正数表示赢利,负数表示亏损):
经济前景等级
乐观
尚可
悲观
物联网项目年回报率(%)
12
4
人工智能项目年回报率(%)
7
5
根据以上信息,请分别计算这两种投资项目的年回报率的期望与方差,并用统计学知识给出投资建议.
【答案】(1)
(2)见解析
【解析】
【分析】
(1)得预期为“乐观”的人数为,结合独立重复实验的概率公式即可得解.
(2)分别计算各等级概率,再利用期望公式与方差公式直接计算.
(1)
由题意可知名被采访者中,预测中国经济前景为“乐观”的人数为人,概率为0.2,
若又随机访问了两名业内人士,至少有一个预测中国经济前景为“乐观”的概率为.
(2)
由题意可知,预测中国经济前景为“乐观”的概率为,
预测中国经济前景为“尚可”的概率为,
预测中国经济前景为“悲观”的概率为
设投资物联网和人工智能项目年回报率的期望分别为,,
方差分别为,
则,
,
,
,
则,
投资物联网项目比投资人工智能项目平均年回报率要高,但二者相差不大.
,
投资人工智能项目比投资物联网项目年回报率稳定性更高,风险要小,
建议投资人工智能项目.
30.(2022·广东·铁一中学高三期末)年月底,为严防新型冠状病毒疫情扩散,有效切断病毒传播途径,坚决遏制疫情蔓延势头,确保人民群众生命安全和身体健康,多地相继做出了封城决定.某地在月日至日累计确诊人数如下表:
日期(月)
日
日
日
日
日
日
日
人数(人)
由上述表格得到如散点图(月日为封城第一天).
(1)根据散点图判断与(,均为大于的常数)哪一个适宜作为累计确诊人数与封城后的天数的回归方程类型(给出判断即可,不必说明理由);并根据上表中的数据求出回归方程;
(2)随着更多的医护人员投入疫情的研究,月日武汉影像科医生提出存在大量核酸检测呈阴性(阳性则确诊),但观其肺片具有明显病变,这一提议引起了广泛的关注,月日武汉疾控中心接收了份血液样本,假设每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性样本的概率为,核酸试剂能把阳性样本检测出阳性结果的概率是(核酸检测存在阳性样本检测不出来的情况,但不会把阴性检测呈阳性),求这份样本中检测呈阳性的份数的期望.
参考数据:
其中,,参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【答案】(1)选择,关于的回归方程为;(2)期望为人.
【解析】
【分析】
(1)利用散点图中点的分布可知选择模型较为合适,在等式两边取对数得,令,结合表格中的数据以及最小二乘法公式求得和的值,进而可得出回归模型的解析式;
(2)计算得出,再利用二项分布的期望公式可求得的值.
【详解】
(1)由散点图可知选择,
由两边同时取常用对数得,
设,.
计算,,,
,
把样本中心点代入得.
,关于的回归方程为;
(2)这份样本中检测呈阳性的份数为,
则每份检测出阳性的概率,
由题意可知,(人),
故这份样本中检测呈阳性份数的期望为人.
【点睛】
本题考查非线性回归方程的求解,同时也考查了利用二项分布的期望公式计算随机变量的数学期望,考查计算能力,属于中等题.
31.(2022·江苏海门·高三期末)某网店为预估今年“双11”期间商品销售情况,随机抽取去年“双11”期间购买该店商品的100位买主的购买记录,得到如下数据:
500元及以上
少于500元
合计
男
25
25
50
女
15
35
50
合计
40
60
100
(1)判断是否有95%的把握认为购买金额是否少于500元与性别有关;
(2)为增加销量,该网店计划今年“双11”期间推出如下优惠方案:购买金额不少于500元的买主可抽奖3次,每次中奖概率为(每次抽奖互不影响),中奖1次减50元,中奖2次减100元,中奖3次减150元.据此优惠方案,求在该网店购买500元商品,实际付款数X(元)的分布列和数学期望.
附:χ2=,n=a+b+c+d.
P(χ2≥k)
0.10
0.05
0.025
0.01
0.005
0.001
k
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)有95%的把握认为购买金额是否少于500元与性别有关
(2)分布列见解析,E(X)=450
【解析】
【分析】
(1)根据列联表中的数据,可以求得卡方系数,再与3.841比较大小,即可得到答案;
(2)X的可能取值为500,450,400,350,写出分布列,再代入期望公式;
(1)
根据列联表中的数据,可以求得χ2=≈4.1667>3.841,
所以我们有95%的把握认为购买金额是否少于500元与性别有关.
(2)
因为购买金额不少于500元的买主可抽奖3次,中奖1次减50元,中奖2次减100元,中奖3次减150元,所以X的可能取值为500,450,400,350,因为每次中奖概率为,所以不中奖的概率为.
所以,
P(X=450)=()2=,
P(X=400)=()2=,
.
实际付款数X(元)的分布列为:
X
500
450
400
350
P
E(X)=500×+450×+400×+350×=450.
32.(2022·江苏扬州·高三期末)为了更好满足人民群众的健身和健康需求,国务院印发了《全民健身计划()》.某中学为了解学生对上述相关知识的了解程度,先对所有学生进行了问卷测评,所得分数的分组区间为、、、、,由此得到总体的频率分布直方图,再利用分层抽样的方式随机抽取名学生进行进一步调研,已知频率分布直方图中、、成公比为的等比数列.
(1)若从得分在分以上的样本中随机选取人,用表示得分高于分的人数,求的分布列及期望;
(2)若学校打算从这名学生中依次抽取名学生进行调查分析,求在第一次抽出名学生分数在区间内的条件下,后两次抽出的名学生分数在同一分组区间的概率.
【答案】(1)分布列见解析,期望为;
(2).
【解析】
【分析】
(1)求出的值,分析可知随机变量的可能取值有、、,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,进一步可求得随机变量的数学期望值;
(2)记事件第一次抽出名学生分数在区间内,记事件后两次抽出的名学生分数在同一分组区间内,利用条件概率公式可求得所求事件的概率.
(1)
解:由题意得,,因为,所以.
由分层抽样,抽出的名学生中得分位于区间内有人,
位于内有人,位于内有人,
位于内有人,位于区间学生有人,
这样,得分位于分以上的共有人,其中得分位于的有人,
所以的可能取值有、、,,,,
所以的分布列为:
所以.
(2)
解:记事件第一次抽出名学生分数在区间内,
记事件后两次抽出的名学生分数在同一分组区间内,
则,,
由条件概率公式可得.
33.(2022·江苏通州·高三期末)当今时代,国家之间的综合国力的竞争,在很大程度上表现为科学技术水平与创新能力的竞争.特别是进入人工智能时代后,谁掌握了核心科学技术,谁就能对竞争对手进行降维打击.我国自主研发的某种产品,其厚度越小,则该种产品越优良,为此,某科学研发团队经过较长时间的实验研发,不断地对该产品的生产技术进行改造提升,最终使该产品的优良厚度达到领先水平并获得了生产技术专利.
(1)在研发过程中,对研发时间x(月)和产品的厚度y(nm)进行统计,其中1~7月的数据资料如下:
x(月)
1
2
3
4
5
6
7
y(nm)
99
99
45
32
30
24
21
现用作为y关于x的回归方程类型,请利用表中数据,求出该回归方程,并估计该产品的“理想”优良厚度约为多少?
(2)某企业现有3条老旧的该产品的生产线,迫于竞争压力,决定关闭并出售生产线.现有以下两种售卖方案可供选择:
①直接售卖,则每条生产线可卖5万元;
②先花20万元购买技术专利并对老旧生产线进行改造,使其达到生产领先水平后再售卖.已知在改造过程中,每条生产线改造成功的概率均为,若改造成功,则每条生产线可卖20万元;若改造失败,则卖价为0万元.请判断该企业应选择哪种售卖方案更为科学? 并说明理由.
参考数据:设z=,zi=,=0.37,=50,=184.5,-72=0.55;
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=u+中的斜率和纵截距的最小二乘法估计的计算公式为=,=-.
【答案】(1),13nm;
(2)方案②,详见解析.
【解析】
【分析】
(1)利用回归直线公式即求;
(2)分别计算两种方案的收益,比较即得.
(1)
由题可得,
∴,
∴,
∵,
∴,即该产品的“理想”优良厚度约为13nm.
(2)
方案①,售卖收益为万元;
方案②,设为3条老旧生产线改造成功的收益,的可能取值为-20,0,20,40,
,,
,,
∴,
∵,
∴该企业应选择方案②更为科学.
34.(2022·江苏宿迁·高三期末)为了提高生产效率,某企业引进一条新的生产线,现要定期对产品进行检测.每次抽取100件产品作为样本,检测新产品中的某项质量指标数,根据测量结果得到如下频率分布直方图.
(1)指标数不在和之间的产品为次等品,试估计产品为次等品的概率;
(2)技术评估可以认为,这种产品的质量指标数服从正态分布,其中近似为样本的平均数(同一组中的数据用该组区间的中点值为代表),计算值,并计算产品指标数落在内的概率.
参考数据:,则,.
【答案】(1)
(2),0.9544
【解析】
【分析】
(1)由频率和为1求参数,结合频率直方图求在和的频率即可得出结果.
(2)按平均数公式求解,由,根据公式对比计算即可得出结果.
(1)
由,解得,
样本中指标数不在和之间的频率为,
所以产品为次等品的概率估计值为.
(2)
依题意.
所以,
所以.
35.(2022·江苏海安·高三期末)为保护生态环境,减少污染物排放,某厂用“循环吸附降污法”减少污水中有害物,每次吸附后污水中有害物含量y(单位:mg/L)与吸附前的含量x(单位:mg/L)有关,该有害物的排放标准是不超过4 mg/L.现有一批污水,其中该有害物含量为2710 mg/L,5次循环吸附降污过程中的监测数据如下表:
第1次
第2次
第3次
第4次
第5次
吸附前的含量x mg/L
2710
880
290
90
30
吸附后的含量y mg/L
880
290
90
30
10
(1)已知y关于x的经验回归方程为.请你预测首次达到排放标准时有害物的含量;
(2)视(1)中所求的预测含量为实际排放含量,排放前,取n份处理后的污水样品检测该有害物的含量.已知检测结果的误差zn~N(0,)(zn单位:mg),至少要取多少份样品检测,才能确保检测结果符合排放标准的概率不小于0.9987.
附:若X~N(μ,σ2),则P(|X-μ|≤3σ)≈0.9974).
【答案】(1) ,当 时,,达到排放标准,此时,排放有害物的含量为3.25mg/L.
(2)至少要取37份样品检测,才能确保检测结果符合排放标准的概率不低于0.9987.
【解析】
【分析】
(1)计算 和 ,代入经验回归方程求 ;
(2)通过二项分布计算 ,再计算 .
(1)
由题意可得,
, ,
所以 ,
所以 .
当 时,,达到排放标准,此时,排放有害物的含量为3.25mg/L.
(2)
记检测结果为 mg/L,由(1)知,.
要使检测结果符合排放标准的概率不小于0.9987,
需 .
又因为 ,即 的期望 , ,
所以 .
所以,
所以,至少要取37份样品检测,才能确保检测结果符合排放标准的概率不低于0.9987.
36.(2022·江苏如东·高三期末)大气污染物PM2.5(大气中直径小于或等于2.5μm的颗粒物)的浓度超过一定的限度会影响人的身体健康.为了研究PM2.5的浓度受汽车流量影响的程度,某校数学建模社团选择了学校附近5个监测点,统计每个监测点24h内过往的汽车流量(单位:千辆),同时在低空相同的高度测定每个监测点该时间段内的PM2.5的平均浓度(单位:μg/m3)得到的数据如下表所示:
监测点编号
1
2
3
4
5
汽车流量
1.3
1.2
1.6
1.0
0.9
PM2.5浓度
66
72
113
34
35
根据以上信息,完成下列问题:
(1)建立PM2.5的浓度关于汽车流量的一元线性回归模型;
(2)我国规定空气中PM2.5的浓度安全标准为24h平均浓度为75μg/m3,该地为使PM2.5 24h平均浓度不超过68.6,拟对汽车流量作适当控制请你根据本题数据估计汽车流量控制的最大值;
(3)从5个监测点中抽取3个,记PM2.5平均浓度不超过68.6的个数为X,求X的分布列和数学期望.
参考公式:==,=-.
【答案】(1);
(2).
(3)分布列见解析,期望为.
【解析】
【分析】
(1)根据所给数据计算出方程的系数得回归方程;
(2)用回归方程估计的浓度,解不等式可得;
(3)5个监测点中PM2.5平均浓度不超过68.6的有三个:1,4,5,用列举法写出任取3个的基本事件,并得出的基本事件,计数后可得概率,从而得分布列,由期望计算期望.
(1)
,,
,
,
所以回归方程为;
(2)
,,最大值为.
(3)
从5个监测点中任意抽取个的基本事件有:123,124,125,134,135,145,234,235,245,345共10个,
5个监测点中,PM2.5平均浓度不超过68.6的有3个:编号1,4,5,因此的可能分别为,
的基本事件有:123,234,235三个,,
的基本事件有:124,125,134,135,245,345共6个,,
的基本事件有:145一个,,
的分布列为:
1
2
3
.
37.(2022·江苏如皋·高三期末)已知盒子里有6个形状、大小完全相同的小球,其中红、白、黑三种颜色,每种颜色各两个小球现制定如下游戏规则:每次从盒子里不放回的摸出一个球,若取到红球记1分;取到白球记2分;取到黑球记3分.
(1)若从中连续取3个球,求恰好取到3种颜色球的概率;
(2)若从中连续取3个球,记最后总得分为随机变量ξ,求随机变量ξ的分布列.
【答案】(1)
(2)答案见解析
【解析】
【分析】
(1)连续取3个球有中方法,从中连续取3个球,红、白、黑各取一个有种方法,由概率公式计算即可.
(2)由题意得,随机变量ξ的所有可能取值为,依次计算即可求得分布列.
(1)
连续取3个球有中方法,从中连续取3个球,红、白、黑各取一个有种方法,
恰好取到3种颜色球的概率可得.
(2)
由题意得,随机变量ξ的所有可能取值为.
时,两个红球和一个白球,则,
时,两个红球和一个黑球或两个白球和一个红球,则,
时,一个红球和一个白球和一个黑球,则,
时,一个红球和两个黑球,或两个白球和一个黑球,则,
时,两个黑球和一个白球,则.
随机变量ξ的分布列为
4
5
6
7
8
P
38.(2022·江苏常州·高三期末)某型号机床的使用年数和维护费有下表所示的统计资料:
年
2
3
4
5
6
万元
2.0
3.5
6.0
6.5
7.0
在线性回归方程中,,,其中,为样本平均值.
(1)求,的线性回归方程;
(2)某厂该型号的一台机床已经使用了8年,现决定当维护费达到15万元时,更换机床,请估计到第11年结束,是否需要更换机床?
【答案】(1)
(2)不需要更换机床
【解析】
【分析】
(1)依次求出,,,,代入公式可求得,,即可解决;
(2)把代入线性回归方程,求得y值进行比较即可解决.
(1)
,
,
(2)
当时,
故不需要更换机床.
39.(2022·江苏苏州·高三期末)年月国务院印发《全民健身计划》,《计划》中提出了各方面的主要任务,包括加大全民健身场地设施供给、广泛开展全民健身赛事活动、提升科学健身指导服务水平、激发体育社会组织活动、促进重点人群健身活动开展和营造全民健身社会氛围等.在各种健身的方式中,瑜伽逐渐成为一种新型的热门健身运动.某瑜伽馆在月份随机采访了名市民,对于是否愿意把瑜伽作为主要的健身方式作了调查.
愿意
不愿意
合计
男性
女性
合计
(1)能否在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关?
附:
(2)为了推广全民健身,某市文化馆计划联合该瑜伽馆举办“瑜你一起”的公益活动,在全市范围内开设一期公益瑜伽课,先从上述参与调查的人中选择“愿意”的人按分层抽样抽出人,再从人中随机抽取人免费参加.市文化馆拨给瑜伽馆一定的经费补贴,补贴方案为:男性每人元,女性每人元.求补贴金额的分布列及数学期望(四舍五入精确到元)
【答案】(1)能在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关
(2)的分布列为
期望为1385(元)
【解析】
【分析】
(1)根据公式计算出,和比较大小,得到结论;(2)通过分层抽样算出抽出的男性和女性人数,写出的可能取值,计算出相应的概率,写出分布列,计算出期望.
(1)
由已知得.
所以能在犯错误的概率不超过的前提下认为“愿意把瑜伽作为主要健身方式”与性别有关.
(2)
调查的人中选择“愿意”的人按分层抽样抽出人,
其中男性人数为,女性人数为.
记补贴金额为,则可能为,,.
,,,
则的分布列为
数学期望(元).
40.(2022·江苏无锡·高三期末)近日,中华人民共和国应急管理部公布了《高层民用建筑消防安全规定》.其中提到:在公共门厅等地停放电动车或充电,拒不改正的个人,最高可处以元罚款.为了研究知晓规定是否与年龄有关,某市随机抽取名市民进行抽样调查,得到如下列联表:
知晓
不知晓
总计
年龄
年龄
总计
(1)根据以上统计数据,是否有的把握认为知晓规定与年龄有关?
(2)将上述调查所得的频率视为概率,现在从本地所有市民中,采用随机抽样的方法抽取位市民,记被抽取的位市民中知晓规定的人数为,求的分布列及数学期望
参考公式:,其中.
【答案】(1)有的把握认为知晓规定与年龄有关
(2)分布列见解析,0.8
【解析】
【分析】
(1)计算,比较临界值得出结论即可;
(2)根据n此独立重复试验,计算概率得到分布列,计算期望或直接根据二项分布求解.
(1)
有的把握认为知晓规定与年龄有关.
(2)
随机抽取一位市民知晓规定的概率为,
的所有可能取值为
,
,,
的分布列如下:
期望
或由,.
2021_2023年高考数学真题分类汇编专题14概率与统计解答题文: 这是一份2021_2023年高考数学真题分类汇编专题14概率与统计解答题文,共7页。
艺术生高考数学真题演练 专题15 概率与统计(解答题)(学生版): 这是一份艺术生高考数学真题演练 专题15 概率与统计(解答题)(学生版),共14页。
艺术生高考数学真题演练 专题15 概率与统计(解答题)(教师版): 这是一份艺术生高考数学真题演练 专题15 概率与统计(解答题)(教师版),共17页。