搜索
    上传资料 赚现金
    2021版高考文科数学(北师大版)一轮复习教师用书:第十一章 第3讲 变量间的相关关系、统计案例
    立即下载
    加入资料篮
    2021版高考文科数学(北师大版)一轮复习教师用书:第十一章 第3讲 变量间的相关关系、统计案例01
    2021版高考文科数学(北师大版)一轮复习教师用书:第十一章 第3讲 变量间的相关关系、统计案例02
    2021版高考文科数学(北师大版)一轮复习教师用书:第十一章 第3讲 变量间的相关关系、统计案例03
    还剩12页未读, 继续阅读
    下载需要20学贝
    使用下载券免费下载
    加入资料篮
    立即下载

    2021版高考文科数学(北师大版)一轮复习教师用书:第十一章 第3讲 变量间的相关关系、统计案例

    展开

    3讲 变量间的相关关系、统计案例

    一、知识梳理

    1变量间的相关关系

    常见的两变量之间的关系有两类:一类是函数关系另一类是相关关系;与函数关系不同相关关系是一种非确定性关系

    2两个变量的线性相关

    (1)从散点图上看如果这些点从整体上看大致分布在通过散点图中心的一条直线附近称两个变量之间具有线性相关关系这条直线方程叫线性回归方程

    (2)从散点图上看点分布在从左下角到右上角的区域内两个变量的这种相关关系称为正相关点分布在左上角到右下角的区域内两个变量的相关关系为负相关

    (3)回归方程为ybxa其中bayb

    (4)相关系数

    r>0表明两个变量正相关

    r<0表明两个变量负相关

    r的绝对值越接近于1表明两个变量的线性相关性越强r的绝对值越接近于0表明两个变量之间几乎不存在线性相关关系

    3独立性检验

    AB为两个变量每一个变量都可以取两个值变量AA1A21;变量BB1B21通过观察得到下表所示数据:

    B

    A  

    B1

    B2

    A1

    a

    b

    ab

    A2

    c

    d

    cd

    ac

    bd

    nabcd

    χ2用它的大小来检验变量之间是否独立

    χ22.706没有充分的证据判定变量AB有关联可以认为变量AB是没有关联的;

    χ22.70690%的把握判定变量AB有关联;

    χ23.84195%的把握判定变量AB有关联;

    χ26.63599%的把握判定变量AB有关联

    常用结论

    1求解线性回归方程的关键是确定回归系数ab应充分利用线性回归方程过样本中心点()

    2根据χ2的值可以判断两个分类变量有关的可信程度χ2越大则两分类变量有关的把握越大

    3根据线性回归方程计算的y仅是一个预报值不是真实发生的

    二、教材衍化

    1已知xy之间的一组数据如表:

    x

    0

    1

    2

    3

    y

    m

    3

    5.5

    7

    已求得y关于x的线性回归方程为y2.1x0.85m的值为________

    答案:0.5

    2为了判断高中三年级学生是否选修文科与性别的关系现随机抽取50名学生得到如下2×2列联表:

     

    理科

    文科

    13

    10

    7

    20

    已知P(χ2>3.841)0.05P(χ2>6.635)0.01.

    根据表中数据得到

    χ24.844.则认为选修文科与性别有关系出错的可能性为________

    解析:χ24.844>3.841这表明小概率事件发生根据假设检验的基本原理应该断定是否选修文科与性别之间有关系成立并且这种判断出错的可能性约为5%.

    答案:5%

    一、思考辨析

    判断正误(正确的打“√”错误的打“×”)

    (1)相关关系与函数关系都是一种确定性的关系也是一种因果关系(  )

    (2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示(  )

    (3)只有两个变量有相关关系所得到的回归模型才有预测价值(  )

    (4)事件XY的关系越密切由观测数据计算得到的χ2的观测值越大(  )

    (5)通过线性回归方程ybxa可以估计和观测变量的取值和变化趋势(  )

    答案:(1)× (2) (3) (4) (5)

    二、易错纠偏

    (1)混淆相关关系与函数关系;

    (2)对独立性检验χ2值的意义不清楚;

    (3)不知道线性回归直线必过样本点中心

    1两个变量的相关关系有正相关负相关不相关则下列散点图从左到右分别反映的变量间的相关关系是(  )

    A①②③   B②③①

    C②①③   D①③②

    解析:D.第一个散点图中散点图中的点是从左下角区域分布到右上角区域则是正相关;第三个散点图中散点图中的点是从左上角区域分布到右下角区域则是负相关;第二个散点图中散点图中的点的分布没有什么规律则是不相关所以应该是①③②.

    2某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系运用2×2列联表进行独立性检验经计算χ27.069则所得到的统计学结论是:有多少的把握认为学生性别与支持该活动有关系(  )

    A0.1%   B1% 

    C99%   D99.9%

    解析:C.因为7.069与附表中的6.635最接近所以得到的统计学结论是:有10.0100.9999%的把握认为学生性别与支持该活动有关系

    3已知xy的取值如下表从散点图可以看出yx线性相关且线性回归方程为y0.95xaa________

    x

    0

    1

    3

    4

    y

    2.2

    4.3

    4.8

    6.7

    解析:由已知得24.5因为线性回归方程经过点()所以a4.50.95×22.6.

    答案:2.6

    相关关系的判断(师生共研)

    已知变量xy满足关系y=-0.1x1变量yz正相关下列结论中正确的是(  )

    Axy正相关xz负相关  

    Bxy正相关xz正相关

    Cxy负相关xz负相关  

    Dxy负相关xz正相关

    解析 因为y=-0.1x1的斜率小于0xy负相关因为yz正相关可设zbyab>0zbya=-0.1bxbaxz负相关

    答案 C

    判定两个变量正、负相关性的方法

    (1)画散点图:点的分布从左下角到右上角两个变量正相关;点的分布从左上角到右下角两个变量负相关 

    (2)相关系数r>0正相关;r<0负相关

    (3)线性回归方程中b>0正相关;b<0负相关

    1对变量xy有观测数据(xiyi)(i1210)得散点图如图对变量uv有观测数据(uivi)(i1210)得散点图如图.由这两个散点图可以判断(  )

    A变量xy正相关uv正相关

    B变量xy正相关uv负相关

    C变量xy负相关uv正相关

    D变量xy负相关uv负相关

    解析:C.由散点图可得两组数据均线性相关且题图的线性回归方程斜率为负题图的线性回归方程斜率为正则由散点图可判断变量xy负相关uv正相关

    2对变量xy有观测数据(xiyi)(i12345)得表1;对变量uv有观测数据(uivi)(i12345)得表2.由这两个表可以判断(  )

    1

    x

    1

    2

    3

    4

    5

    y

    2.9

    3.3

    3.6

    4.4

    5.1

    2

    u

    1

    2

    3

    4

    5

    v

    25

    20

    21

    15

    13

    A.变量xy正相关uv正相关

    B变量xy负相关uv正相关

    C变量xy负相关uv负相关

    D变量xy正相关uv负相关

    解析:D.由题可知随着x的增大对应的y值增大其散点图呈上升趋势xy正相关;随着u的增大v减小其散点图呈下降趋势uv负相关

    线性回归方程及其应用(师生共研)

    (2020·江西宜春模拟)随着我国中医学的发展药用昆虫的使用相应愈来愈多每年春暖以后至寒冬前昆虫大量活动与繁殖易于采集各种药用昆虫已知一只药用昆虫的产卵数y(单位:个)与一定范围内的温度x(单位:)有关于是科研人员在3月份的31天中随机挑选了5天进行研究现收集了该种药用昆虫的5组观测数据如下表:

    日期

    2

    7

    15

    22

    30

    温度x/

    10

    11

    13

    12

    8

    产卵数y/

    23

    25

    30

    26

    16

    科研人员确定的研究方案是:先从这5组数据中任选2用剩下的3组数据建立y关于x的线性回归方程再对被选取的2组数据进行检验

    (1)若选取的是32日与30日这2组的数据请根据37日、15日和22日这3组的数据求出y关于x的线性回归方程;

    (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2则认为得到的线性回归方程是可靠的试问(1)中所得的线性回归方程是否可靠?

    附:线性回归方程的斜率和截距的最小二乘估计公式分别为bab.

     (1)由已知数据得1227 (xi)(yi)5 (xi)22.

    所以

    a27×12=-3.

    所以y关于x的线性回归方程为yx3.

    (2)(1)y关于x的线性回归方程为yx3.

    x10y×10322|2223|<2

    x8y×8317|1716|<2.

    所以(1)中所得的线性回归方程yx3是可靠的

    线性回归分析问题的类型及解题方法

    (1)求线性回归方程

    利用公式求出回归系数ba

    待定系数法:利用线性回归方程过样本点的中心求系数

    (2)样本数据的相关系数

    r

    反映样本数据的相关程度|r|越大则相关性越强 

    1对两个变量xy进行线性回归分析计算得到相关系数r=-0.996 2则下列说法中正确的是(  )

    Axy正相关

    Bxy具有较强的线性相关关系

    Cxy几乎不具有线性相关关系

    Dxy的线性相关关系还需进一步确定

    解析:B.因为相关系数r=-0.996 2所以xy负相关因为|r|0.996 2非常接近1所以相关性很强故选B.

    2(2020·成都第一次诊断性检测)2018年俄罗斯世界杯期间莫斯科的部分餐厅销售了来自中国的小龙虾这些小龙虾均标有等级代码为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系经统计得到如下数据:

    等级代码数值x

    38

    48

    58

    68

    78

    88

    销售单价y/

    16.8

    18.8

    20.8

    22.8

    24

    25.8

    (1)已知销售单价y与等级代码数值x之间存在线性相关关系y关于x的线性回归方程(系数精确到0.1)

    (2)若莫斯科某餐厅销售的中国小龙虾的等级代码数值为98请估计该等级的中国小龙虾销售单价为多少元?

    参考公式:对于一组数据(x1y1)(x2y2)(xnyn)其线性回归方程ybxa的斜率和截距的最小二乘估计分别为bab.

    参考数据:xiyi8 440x25 564.

    解:(1)由题意63

    21.5

    b0.2

    ab21.50.2×638.9.

    故所求线性回归方程为y0.2x8.9.

    (2)(1)知当x98y0.2×988.928.5.

    所以估计该等级的中国小龙虾销售单价为28.5

    独立性检验(师生共研)

    (2019·高考全国卷改编)某商场为提高服务质量随机调查了50名男顾客和50名女顾客每位顾客对该商场的服务给出满意或不满意的评价得到下面列联表:

     

    满意

    不满意

    男顾客

    40

    10

    女顾客

    30

    20

    (1)分别估计男、女顾客对该商场服务满意的概率;

    (2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?

    附:χ2.

    P(χ2>k)

    0.050

    0.010

    0.001

    k

    3.841

    6.635

    10.828

     (1)由调查数据知男顾客中对该商场服务满意的比率为0.8因此男顾客对该商场服务满意的概率的估计值为0.8.

    女顾客中对该商场服务满意的比率为0.6因此女顾客对该商场服务满意的概率的估计值为0.6.

    (2)χ24.762.

    由于4.762>3.841故有95%的把握认为男、女顾客对该商场服务的评价有差异

    (1)独立性检验的一般步骤

    根据样本数据制成2×2列联表;

    根据公式χ2计算χ2的值;

    查表比较χ2与临界值的大小关系作出统计判断

    (2)解独立性检验的应用问题的关注点

    两个明确:()明确两类主体;()明确研究的两个问题;

    两个准确:()准确画出2×2列联表;()准确理解χ2. 

     (2020·陕西渭南模拟考试)为了解某校学生参加社区服务的情况采用按性别分层抽样的方法进行调查已知该校共有学生960其中男生560从全校学生中抽取了容量为n的样本得到一周参加社区服务时间的统计数据如下表:

     

    超过1小时

    不超过1小时

    20

    8

    12

    m

    (1)mn的值;

    (2)能否有95%的把握认为该校学生一周参加社区服务时间是否超过1小时与性别有关?

    附:

    P(χ2>k)

    0.050

    0.010

    0.001

    k

    3.841

    6.635

    10.828

    χ2

    解:(1)由已知该校有女生400m8

    从而n20812848.

    (2)作出2×2列联表如下:

     

    超过1小时的人数

    不超过1小时的人数

    总计

    20

    8

    28

    12

    8

    20

    合计

    32

    16

    48

    χ20.685 7<3.841.

    所以没有95%的把握认为该校学生一周参加社区服务时间是否超过1小时与性别有关

    [基础题组练]

    1(2020·陕西西安陕师大附中等八校联考)设两个变量xy之间具有线性相关关系它们的相关系数为ry关于x的线性回归方程为ykxb(  )

    Akr的符号相同   Bbr的符号相同

    Ckr的符号相反   Dbr的符号相反

    解析:A.因为相关系数r为正表示正相关回归直线方程上升r为负表示负相关回归直线方程下降所以kr的符号相同故选A.

    2在一次对性别与说谎是否相关的调查中得到如下数据:

     

    说谎

    不说谎

    总计

    6

    7

    13

    8

    9

    17

    总计

    14

    16

    30

    根据表中数据得到如下结论正确的一项是(  )

    A在此次调查中有95%的把握认为是否说谎与性别有关

    B在此次调查中有99%的把握认为是否说谎与性别有关

    C在此次调查中有99.5%的把握认为是否说谎与性别有关

    D在此次调查中没有充分的证据显示说谎与性别有关

    解析:D.由已知得χ20.002<0.455所以在犯错误的概率不超过50%的情况下认为说谎与性别无关也就是说在此调查中没有充分的证据显示说谎与性别有关

    3经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系并得到y关于x的回归直线方程:0.245x0.321由回归直线方程可知家庭年收入每增加1万元年饮食支出平均增加________万元

    解析:x变为x1y0.245(x1)0.3210.245x0.3210.245因此家庭年收入每增加1万元年饮食支出平均增加0.245万元

    答案:0.245

    4如图是一组数据(xy)的散点图经最小二乘估计公式计算yx之间的线性回归方程为ybx1b________

    解析:由题图知2

    2.6

    (22.6)代入ybx1解得b0.8.

    答案:0.8

    5(2020·陕西汉中略阳天津高级中学等12校联考)某市为了了解民众对开展创建文明城市工作以来的满意度随机调查了40名群众并将他们随机分成AB两组每组20A组群众给第一阶段的创文工作评分B组群众给第二阶段的创文工作评分根据两组群众的评分绘制了如图所示的茎叶图

    (1)根据茎叶图比较群众对两个阶段的创文工作满意度评分的平均值和集中数据(不要求计算出具体值给出结论即可)

    (2)完成下面的2×2列联表并通过计算判断是否有99%把握认为民众对两个阶段创文工作的满意度存在差异?

     

    低于70

    不低于70

    总计

    第一阶段

     

     

     

    第二阶段

     

     

     

    总计

     

     

     

    参考公式:χ2nabcd.

    P(χ2>k)

    0.050

    0.010

    0.001

    k

    3.841

    6.635

    10.828

    解:(1)根据题中茎叶图可以看出B组群众给第二阶段创文工作满意度评分的平均值高于A组群众给第一阶段创文工作满意度评分的平均值且给分相对于A组更集中些

    (2)填写2×2列联表如下:

     

    低于70

    不低于70

    总计

    第一阶段

    11

    9

    20

    第二阶段

    3

    17

    20

    总计

    14

    26

    40

    所以χ27.033>6.635.

    所以有99%的把握认为民众对两个阶段创文工作的满意度存在差异

    6某品牌手机厂商推出新款的旗舰机型并在某地区跟踪调查得到这款手机上市时间(x个月)和市场占有率(y%)的几组相关对应数据:

    x

    1

    2

    3

    4

    5

    y

    0.02

    0.05

    0.1

    0.15

    0.18

    (1)根据上表中的数据用最小二乘法求出y关于x的线性回归方程;

    (2)根据上述回归方程分析该款旗舰机型市场占有率的变化趋势并预测自上市起经过多少个月该款旗舰机型市场占有率能超过0.5%(精准到月)

    解:(1)根据表中数据

    计算×(12345)3

    ×(0.020.050.10.150.18)0.1

    所以b

    0.042

    所以a0.10.042×3=-0.026

    所以线性回归方程为y0.042x0.026.

    (2)由上面的线性回归方程可知上市时间与市场占有率正相关

    即上市时间每增加1个月市场占有率都增加0.042个百分点;

    y0.042x0.026>0.5解得x13

    预计上市13个月时该款旗舰机型市场占有率能超过0.5%.

    [综合题组练]

    1(2020·兰州市诊断考试改编)一本书一碗面一条河一座桥曾是兰州的城市名片而现在兰州马拉松又成为了兰州的另一张名片随着全民运动健康意识的提高马拉松运动不仅在兰州而且在全国各大城市逐渐兴起参与马拉松训练与比赛的人数逐年增加为此某市对人们参加马拉松运动的情况进行了统计调查其中一项调查是调查人员从参与马拉松运动的人中随机抽取200对其每周参与马拉松长跑训练的天数进行统计得到以下统计表:

    平均每周进行长跑训练天数

    不大于2

    34

    不少于5

    人数

    30

    130

    40

    若某人平均每周进行长跑训练天数不少于5则称其为热烈参与者否则称为非热烈参与者

    (1)经调查该市约有2万人参与马拉松运动试估计其中热烈参与者的人数;

    (2)根据上表的数据填写下列2×2列联表并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为热烈参与马拉松与性别有关?

     

    热烈参与者

    非热烈参与者

    总计

     

     

    140

     

    55

     

    总计

     

     

     

    附:χ2(n为样本容量)

    P(χ2>k)

    0.500

    0.400

    0.250

    0.150

    0.100

    0.050

    0.025

    0.010

    0.005

    0.001

    k

    0.455

    0.708

    1.323

    2.072

    2.706

    3.841

    5.024

    6.635

    7.879

    10.828

    解:(1)200人中热烈参与者的频率作为概率则该市热烈参与者的人数约为20 000×4 000.

    (2)2×2列联表为

     

    热烈参与者

    非热烈参与者

    总计

    35

    105

    140

    5

    55

    60

    总计

    40

    160

    200

    χ27.292>6.635.

    故能在犯错误的概率不超过0.01的前提下认为热烈参与马拉松与性别有关

    2(2020·鹰潭市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入计划收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:

    月份

    1

    2

    3

    4

    5

    6

    广告投入量/万元

    2

    4

    6

    8

    10

    12

    收益/万元

    14.21

    20.31

    31.8

    31.18

    37.83

    44.67

    他们用两种模型ybxayaebx分别进行拟合得到相应的线性回归方程并进行残差分析得到如图所示的残差图及一些统计量的值:

    xiyi

    x

    7

    30

    1 464.24

    364

    (1)根据残差图比较模型的拟合效果应选择哪个模型?并说明理由;

    (2)残差绝对值大于2的数据被认为是异常数据需要剔除

    剔除异常数据后求出(1)中所选模型的线性回归方程;

    广告投入量x18(1)中所选模型收益的预报值是多少?

    附:对于一组数据(x1y1)(x2y2)(xnyn)其线性回归方程ybxa的斜率和截距的最小二乘估计分别为:bab.

    解:(1)应该选择模型因为模型的残差点比较均匀地落在水平的带状区域中且模型的带状区域比模型的带状区域窄所以模型的拟合精度高线性回归方程的预报精度高

    (2)剔除异常数据3月份的数据后

    ×(7×66)7.2

    ×(30×631.8)29.64.

    xiyi1 464.246×31.81 273.44

    x36462328.

    b3

    ab29.643×7.28.04.

    所以y关于x的线性回归方程为y3x8.04.

    x18代入()中所求线性回归方程得y3×188.0462.04.

    故预报值为62.04万元

     

     

    • 精品推荐
    • 所属专辑

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:0份资料
    • 充值学贝下载 90%的用户选择 本单免费
    • 扫码直接下载
    选择教习网的 4 个理由
    • 更专业

      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿

    • 更丰富

      涵盖课件/教案/试卷/素材等各种教学资源;500万+优选资源 ⽇更新5000+

    • 更便捷

      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤

    • 真低价

      超⾼性价⽐, 让优质资源普惠更多师⽣

    开票申请 联系客服
    本次下载需要:0学贝 0学贝 账户剩余:0学贝
    本次下载需要:0学贝 原价:0学贝 账户剩余:0学贝
    了解VIP特权
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送

        扫码支付后直接下载

        0元

        扫码支付后直接下载

        使用学贝下载资料比扫码直接下载优惠50%
        充值学贝下载,本次下载免费
        了解VIP特权
        • 微信
        • 支付宝

        微信扫码支付

        支付宝扫码支付(支持花呗)

        到账0学贝
        • 微信
        • 支付宝

        微信扫码支付

        支付宝扫码支付 (支持花呗)

          下载成功

          Ctrl + Shift + J 查看文件保存位置

          若下载不成功,可重新下载,或查看 资料下载帮助

          本资源来自成套资源

          更多精品资料

          正在打包资料,请稍候…

          预计需要约10秒钟,请勿关闭页面

          服务器繁忙,打包失败

          请联系右侧的在线客服解决

          单次下载文件已超2GB,请分批下载

          请单份下载或分批下载

          支付后60天内可免费重复下载

          我知道了
          正在提交订单

          欢迎来到教习网

          • 900万优选资源,让备课更轻松
          • 600万优选试题,支持自由组卷
          • 高质量可编辑,日均更新2000+
          • 百万教师选择,专业更值得信赖
          微信扫码注册
          qrcode
          二维码已过期
          刷新

          微信扫码,快速注册

          还可免费领教师专享福利「樊登读书VIP」

          手机号注册
          手机号码

          手机号格式错误

          手机验证码 获取验证码

          手机验证码已经成功发送,5分钟内有效

          设置密码

          6-20个字符,数字、字母或符号

          注册即视为同意教习网「注册协议」「隐私条款」
          QQ注册
          手机号注册
          微信注册

          注册成功

          下载确认

          下载需要:0 张下载券

          账户可用:0 张下载券

          立即下载

          如何免费获得下载券?

          加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

          即将下载

          2021版高考文科数学(北师大版)一轮复习教师用书:第十一章 第3讲 变量间的相关关系、统计案例

          该资料来自成套资源,打包下载更省心

          [共10份]
          浏览全套
            立即下载(共1份)
            返回
            顶部