搜索
    上传资料 赚现金
    2020年高考数学一轮复习教案:第9章 第4节 变量间的相关关系、统计案例(含解析)
    立即下载
    加入资料篮
    2020年高考数学一轮复习教案:第9章 第4节 变量间的相关关系、统计案例(含解析)01
    2020年高考数学一轮复习教案:第9章 第4节 变量间的相关关系、统计案例(含解析)02
    2020年高考数学一轮复习教案:第9章 第4节 变量间的相关关系、统计案例(含解析)03
    还剩9页未读, 继续阅读
    下载需要10学贝
    使用下载券免费下载
    加入资料篮
    立即下载

    2020年高考数学一轮复习教案:第9章 第4节 变量间的相关关系、统计案例(含解析)

    展开

    第四节 变量间的相关关系、统计案例

    [考纲传真] 1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验的基本思想、方法及其初步应用.4.了解回归分析的基本思想、方法及简单应用.

    1变量间的相关关系

    (1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.

    (2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的这种相关关系称为负相关

    2两个变量的线性相关

    (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线

    (2)回归方程为x,其中.

    (3)通过求Q (yibxia)2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.

    (4)相关系数:

    r>0时,表明两个变量正相关

    r<0时,表明两个变量负相关

    r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.

    (5)相关指数:R21.其中是残差平方和,其值越小,则R2越大(接近1),模型的拟合效果越好.

    3独立性检验

    假设有两个分类变量XY,它们的取值分别为{x1x2}{y1y2},其样本频数列联表(称为2×2列联表)为:

     

    y1

    y2

    总计

    x1

    a

    b

    ab

    x2

    c

    d

    cd

    总计

    ac

    bd

    abcd

    K2(其中nabcd)

    1从散点图观察相关性;

    (1)正相关:样本点分布在从左下角到右上角的区域;

    (2)负相关:样本点分布在从左上角到右下角的区域.

    2.的几何意义:体现平均增加或平均减少.

    3线性回归方程x一定过样本点的中心()

    4由回归直线求出的数据是估算值,不是精确值.

    [基础自测]

    1(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)

    (1)相关关系与函数关系都是一种确定性的关系,   也是一种因果关系.(  )

    (2)只有两个变量有相关关系,所得到的回归模型才有预测价值.(  )

    (3)事件XY关系越密切,则由观测数据计算得到的K2的观测值越大.(  )

    (4)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.(  )

    [答案] (1)× (2) (3) (4)×

    2(教材改编)为调查中学生近视情况,测得某校男生150名中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力(  )

    A.回归分析        B.均值与方差

    C.独立性检验   D.概率

    C [近视性别是两类变量,其是否有关,应用独立性检验判断.]

    3(教材改编)已知变量xy正相关,且由观测数据算得样本平均数33.5,则由该观测数据算得的线性回归方程可能是(  )

    A.0.4x2.3   B.2x2.4

    C.=-2x9.5   D.=-0.3x4.4

    A [因为变量xy正相关,排除选项CD.又样本中心(3,3.5) 在回归直线上,排除B,选项A满足.]

    4.下面是2×2列联表:则表中ab的值分别为(  )

     

    y1

    y2

    合计

    x1

    a

    21

    73

    x2

    22

    25

    47

    合计

    b

    46

    120

    A.94,72         B52,50

    C52,74   D74,52

    C [a2173a52.a22bb74.]

    5.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K27.069,则所得到的统计学结论是:有多少的把握认为学生性别与支持该活动有关系”.(  )

    附:

    P(K2k0)

    0.100

    0.050

    0.025

    0.010

    0.001

    k0

    2.706

    3.841

    5.024

    6.635

    10.828

    A.0.1%          B1%

    C99%   D99.9%

    C [因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有10.0100.9999%的把握认为学生性别与支持该活动有关系”.]

    相关关系的判断

    1.已知变量xy满足关系y=-0.1x1,变量yz正相关.下列结论中正确的是(  )

    Axy正相关,xz负相关

    Bxy正相关,xz正相关

    Cxy负相关,xz负相关

    Dxy负相关,xz正相关

    C [因为y=-0.1x1的斜率小于0,故xy负相关.因为yz正相关,可设zy0,则zy=-0.1x,故xz负相关.]

    2.甲、乙、丙、丁四位同学各自对AB两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:

     

    r

    0.82

    0.78

    0.69

    0.85

    m

    106

    115

    124

    103

    则哪位同学的试验结果体现AB两变量有更强的线性相关性(  )

    A.甲    B.乙    C.丙    D.丁

    D [在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了AB两变量有更强的线性相关性.]

    3(2019·泰安月考)xy的散点图如图所示,则下列说法中所有正确命题的序号为________

    xy是负相关关系;

    在该相关关系中,若用yc1ec2x拟合时的相关指数为R,用x拟合时的相关指数为R,则R>R

    xy之间不能建立线性回归方程.

    ①② [在散点图中,点散布在从左上角到右下角的区域,因此xy是负相关关系,故正确;由散点图知用yc1ec2x拟合比用x拟合效果要好,则R>R,故正确;xy之间可以建立线性回归方程,但拟合效果不好,故错误.]

    [规律方法] 判定两个变量正、负相关性的方法

    1画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.

    2相关系数:r>0时,正相关;r0时,负相关.

    3线性回归方程中:时,正相关;时,负相关.

     

    线性回归分析及应用

     

    【例1】 (2018·全国卷)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.

    为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,217)建立模型=-30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,27)建立模型9917.5t.

    (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;

    (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

    [] (1)利用模型,可得该地区2018年的环境基础设施投资额的预测值为=-30.413.5×19226.1(亿元)

    利用模型,可得该地区2018年的环境基础设施投资额的预测值为

    9917.5×9256.5(亿元)

    (2)利用模型得到的预测值更可靠.

    理由如下:

    (i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势,2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.

    ()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.

    [规律方法] 线性回归分析问题的类型及解题方法

    1求线性回归方程:

    利用公式,求出回归系数

    待定系数法:利用回归直线过样本点中心求系数.

    2利用回归方程进行预测:,把回归直线方程看作一次函数,求函数值.

    3利用回归直线判断正、负相关:

    决定正相关还是负相关的是系数

    (2018·临沂期末)某市春节期间7家超市广告费支出xi(万元)和销售额yi(万元)数据如下表:

    超市

    A

    B

    C

    D

    E

    F

    G

    广告费支出xi

    1

    2

    4

    6

    11

    13

    19

    销售额yi

    19

    32

    40

    44

    52

    53

    54

    (1)若用线性回归模型拟合yx的关系,求yx的线性回归方程;

    (2)若用二次函数回归模型拟合yx的关系,可得回归方程:=-0.17x25x20,经计算,二次函数回归模型和线性回归模型的R2分别约为0.930.75,请用R2说明选择哪个回归模型更合适,并用此模型预测A超市广告费支出3万元时的销售额.

    参考数据:.

    参考公式:

    [] (1)

    1.7

    y关于x的线性回归方程是1.7x28.4.

    (2)0.750.93二次函数回归模型更合适.

    x3时,33.5.

    故选择二次函数回归模型更合适,并且用此模型预测A超市广告费支出3万元时的销售额为33.5万元.

     

    独立性检验及应用

    【例2】 (2017·全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:                               

    (1)A表示事件旧养殖法的箱产量低于50 kg,估计A的概率;

    (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;

     

    箱产量<50 kg

    箱产量50 kg

    旧养殖法

     

     

    新养殖法

     

     

    (3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.

    附:

    P(K2k0)

    0.050

    0.010

    0.001

    k0

    3.841

    6.635

    10.828

    K2.

    [] (1)旧养殖法的箱产量低于50 kg的频率为

    (0.0120.0140.0240.0340.040)×50.62.

    因此,事件A的概率估计值为0.62.

    (2)根据箱产量的频率分布直方图得列联表

     

    箱产量<50 kg

    箱产量50 kg

    旧养殖法

    62

    38

    新养殖法

    34

    66

    K2的观测值k15.705.

    由于15.7056.635,故有99%的把握认为箱产量与养殖方法有关.

    (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)50 kg55 kg之间,旧养殖法的箱产量平均值(或中位数)45 kg50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.

    [规律方法] 独立性检验的一般步骤

    1根据样本数据制成2×2列联表;

    2根据公式K2,计算K2的观测值k的值;

    3查表比较K2的观测值k与临界值的大小关系,作统计判断.

    (2019·合肥质检)某校在高一年级学生中,对自然科学类、社会科学类校本选修课程的选课意向进行调查.现从高一年级学生中随机抽取180名学生,其中男生105名;在这180名学生中选择社会科学类的男生、女生均为45名.

    (1)试问:从高一年级学生中随机抽取1人,抽到男生的概率约为多少?

    (2)根据抽取的180名学生的调查结果,完成下面的2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?

     

    选择自然科学类

    选择社会科学类

    合计

    男生

     

     

     

    女生

     

     

     

    合计

     

     

     

    附:K2,其中nabcd.

     

    P(K2

    k0)

    0.500

    0.400

    0.250

    0.150

    0.100

    0.050

    0.025

    0.010

    0.005

    0.001

    k0

    0.455

    0.708

    1.323

    2.072

    2.706

    3.841

    5.024

    6.635

    7.879

    10.828

    [] (1)从高一年级学生中随机抽取1人,抽到男生的概率约为.

    (2)根据统计数据,可得2×2列联表如下:

     

    选择自然科学类

    选择社会科学类

    合计

    男生

    60

    45

    105

    女生

    30

    45

    75

    合计

    90

    90

    180

    K2的观测值为k5.142 95.024

    所以能在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关.

    (2018·全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:

    (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;

    (2)40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:

     

    超过m

    不超过m

    第一种生产方式

     

     

    第二种生产方式

     

     

    (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?

    附:K2

    P(K2k0)

    0.050

    0.010

    0.001

    k0

    3.841

    6.635

    10.828

    [] (1)第二种生产方式的效率更高.

    理由如下:

    ()由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.

    ()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.

    ()由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.

    ()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.

    (以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.)

    (2)由茎叶图知m80.

    列联表如下:

     

    超过m

    不超过m

    第一种生产方式

    15

    5

    第二种生产方式

    5

    15

    (3)由于K2的观测值k10>6.635,所以有99%的把握认为两种生产方式的效率有差异.

     

    • 精品推荐
    • 所属专辑

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:0份资料
    • 充值学贝下载 90%的用户选择 本单免费
    • 扫码直接下载
    选择教习网的 4 个理由
    • 更专业

      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿

    • 更丰富

      涵盖课件/教案/试卷/素材等各种教学资源;500万+优选资源 ⽇更新5000+

    • 更便捷

      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤

    • 真低价

      超⾼性价⽐, 让优质资源普惠更多师⽣

    开票申请 联系客服
    本次下载需要:0学贝 0学贝 账户剩余:0学贝
    本次下载需要:0学贝 原价:0学贝 账户剩余:0学贝
    了解VIP特权
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送

        扫码支付后直接下载

        0元

        扫码支付后直接下载

        使用学贝下载资料比扫码直接下载优惠50%
        充值学贝下载,本次下载免费
        了解VIP特权
        • 微信
        • 支付宝

        微信扫码支付

        支付宝扫码支付(支持花呗)

        到账0学贝
        • 微信
        • 支付宝

        微信扫码支付

        支付宝扫码支付 (支持花呗)

          下载成功

          Ctrl + Shift + J 查看文件保存位置

          若下载不成功,可重新下载,或查看 资料下载帮助

          本资源来自成套资源

          更多精品资料

          正在打包资料,请稍候…

          预计需要约10秒钟,请勿关闭页面

          服务器繁忙,打包失败

          请联系右侧的在线客服解决

          单次下载文件已超2GB,请分批下载

          请单份下载或分批下载

          支付后60天内可免费重复下载

          我知道了
          正在提交订单

          欢迎来到教习网

          • 900万优选资源,让备课更轻松
          • 600万优选试题,支持自由组卷
          • 高质量可编辑,日均更新2000+
          • 百万教师选择,专业更值得信赖
          微信扫码注册
          qrcode
          二维码已过期
          刷新

          微信扫码,快速注册

          还可免费领教师专享福利「樊登读书VIP」

          手机号注册
          手机号码

          手机号格式错误

          手机验证码 获取验证码

          手机验证码已经成功发送,5分钟内有效

          设置密码

          6-20个字符,数字、字母或符号

          注册即视为同意教习网「注册协议」「隐私条款」
          QQ注册
          手机号注册
          微信注册

          注册成功

          下载确认

          下载需要:0 张下载券

          账户可用:0 张下载券

          立即下载

          如何免费获得下载券?

          加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

          即将下载

          2020年高考数学一轮复习教案:第9章 第4节 变量间的相关关系、统计案例(含解析)

          该资料来自成套资源,打包下载更省心

          [共10份]
          浏览全套
            立即下载(共1份)
            返回
            顶部