搜索
    上传资料 赚现金
    2024一轮数学讲义+题型细分与精练 95个专题 524个题型成对数据的统计分析——讲义
    立即下载
    加入资料篮
    2024一轮数学讲义+题型细分与精练 95个专题 524个题型成对数据的统计分析——讲义01
    2024一轮数学讲义+题型细分与精练 95个专题 524个题型成对数据的统计分析——讲义02
    还剩2页未读, 继续阅读
    下载需要10学贝
    使用下载券免费下载
    加入资料篮
    立即下载

    2024一轮数学讲义+题型细分与精练 95个专题 524个题型成对数据的统计分析——讲义

    展开
    这是一份2024一轮数学讲义+题型细分与精练 95个专题 524个题型成对数据的统计分析——讲义,共4页。

    【知识点梳理】
    1.相关关系
    两个变量间的关系有函数关系,相关关系和不相关关系
    两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
    2.正相关、负相关
    从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果一个变量值增加时,另一个变量的相应值呈现减少的趋势,则称这个两个变量负相关.
    3.线性相关
    一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条线附近,我们就称这两个变量线性相关.
    一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
    4.相关系数r的计算
    注意:相关系数是研究变量之间线性相关程度的量
    假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),对数据作进一步的“标准化处理”处理,用sx=eq \r(\f(1,n)\(∑,\s\up10 (n),\s\d10(i=1)) (xi-\(x,\s\up6(-)))2),sy=eq \r(\f(1,n)\(∑,\s\up10 (n),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2)分别除xi-eq \(x,\s\up6(-))和yi-eq \(y,\s\up6(-)) (i=1,2,…,n,eq \(x,\s\up6(-))和eq \(y,\s\up6(-))分别为x1,x2,…,xn和y1,y2,…,yn的均值),得eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(x1-\(x,\s\up6(-)),sx),\f(y1-\(y,\s\up6(-)),sy))),eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(x2-\(x,\s\up6(-)),sx),\f(y2-\(y,\s\up6(-)),sy))),…,eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(xn-\(x,\s\up6(-)),sx),\f(yn-\(y,\s\up6(-)),sy))),为简单起见,把上述“标准化”处理后的成对数据分别记为(x1′,y1′),(x2′,y2′),…,(xn′,yn′),则变量x和变量y的样本相关系数r的计算公式如下:
    r=eq \f(1,n)(x1′y1′+x2′y2′+…+xn′yn′)
    =eq \f(\(∑,\s\up10(n),\s\d10(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up10(n),\s\d10(i=1)) (xi-\(x,\s\up6(-)))2)\r(\(∑,\s\up10(n),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2)).
    5.相关系数r的性质
    (1)当r>0时,称成对样本数据正相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.
    (2)样本相关系数r的取值范围为[-1,1].
    当|r|越接近1时,成对样本数据的线性相关程度越强;
    当|r|越接近0时,成对样本数据的线性相关程度越弱.
    6.样本相关系数与标准化数据向量夹角的关系
    r=eq \f(1,n)x′·y′=eq \f(1,n)|x′||y′|cs θ=cs θ(其中x′=(x1′,x2′,…,xn′),y′=(y1′,y2′,…,yn′),|x′|=|y′|=eq \r(n),θ为向量x′和向量y′的夹角).
    专题94 一元线性回归模型及其应用
    【知识点梳理】
    1.一元线性回归模型
    我们称
    eq \b\lc\{(\a\vs4\al\c1(Y=bx+a+e,,E(e)=0,D(e)=σ2))
    为Y关于x的一元线性回归模型,其中Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
    2.线性回归方程与最小二乘法
    回归直线方程过样本点的中心(eq \(x,\s\up6(-)),eq \(y,\s\up6(-))),是回归直线方程最常用的一个特征
    我们将eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的eq \(b,\s\up6(^)),eq \(a,\s\up6(^))叫做b,a的最小二乘估计(least squares estimate ),
    其中
    3.残差的概念
    对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的eq \(y,\s\up6(^))称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
    4.刻画回归效果的方式
    (1)残差图法
    作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
    (2)残差平方和法
    残差平方和eq \(∑,\s\up10(n),\s\d6(i=1)) (yi-eq \(y,\s\up6(^))i)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
    (3)利用R2刻画回归效果
    决定系数R2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.
    R2=1-eq \f(\(∑,\s\up10(n),\s\d10(i=1)) (yi-\(y,\s\up6(^))i)2,\(∑,\s\up10(n),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2),R2越大,即拟合效果越好,R2越小,模型拟合效果越差.
    专题95 列联表与独立性检验
    【知识点梳理】
    1.分类变量
    这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种
    我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
    2.2×2列联表
    在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉分类频数.
    一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
    3.等高堆积条形图
    等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
    4.临界值
    χ2 统计量也可以用来作相关性的度量.χ2 越小说明变量之间越独立,χ2越大说明变量之间越相关
    χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.
    5.独立性检验
    基于小概率值α的检验规则是:
    当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
    当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
    这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验(test f independence).
    下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
    6.应用独立性检验解决实际问题的大致步骤
    (1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
    (2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;
    (3)根据检验规则得出推断结论;
    (4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
    y1
    y2
    合计
    x1
    a
    b
    a+b
    x2
    c
    d
    c+d
    合计
    a+c
    b+d
    a+b+c+d
    α
    0.1
    0.05
    0.01
    0.005
    0.001

    2.706
    3.841
    6.635
    7.879
    10.828
    相关试卷

    第02讲 成对数据的统计分析(五大题型)(讲义)-2024年高考数学一轮复习讲义(新教材新高考): 这是一份第02讲 成对数据的统计分析(五大题型)(讲义)-2024年高考数学一轮复习讲义(新教材新高考),文件包含第02讲成对数据的统计分析五大题型讲义原卷版docx、第02讲成对数据的统计分析五大题型讲义解析版docx等2份试卷配套教学资源,其中试卷共78页, 欢迎下载使用。

    2024年高考数学重难点突破讲义:配套热练 第1讲 数据分析——成对数据的统计分析: 这是一份2024年高考数学重难点突破讲义:配套热练 第1讲 数据分析——成对数据的统计分析,共8页。

    微专题18 统计与成对数据的统计分析: 这是一份微专题18 统计与成对数据的统计分析,共12页。

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:0份资料
    • 充值学贝下载 90%的用户选择 本单免费
    • 扫码直接下载
    选择教习网的 4 个理由
    • 更专业

      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿

    • 更丰富

      涵盖课件/教案/试卷/素材等各种教学资源;500万+优选资源 ⽇更新5000+

    • 更便捷

      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤

    • 真低价

      超⾼性价⽐, 让优质资源普惠更多师⽣

    开票申请 联系客服
    本次下载需要:0学贝 0学贝 账户剩余:0学贝
    本次下载需要:0学贝 原价:0学贝 账户剩余:0学贝
    了解VIP特权
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送

        扫码支付后直接下载

        0元

        扫码支付后直接下载

        使用学贝下载资料比扫码直接下载优惠50%
        充值学贝下载,本次下载免费
        了解VIP特权
        • 微信
        • 支付宝

        微信扫码支付

        支付宝扫码支付(支持花呗)

        到账0学贝
        • 微信
        • 支付宝

        微信扫码支付

        支付宝扫码支付 (支持花呗)

          下载成功

          Ctrl + Shift + J 查看文件保存位置

          若下载不成功,可重新下载,或查看 资料下载帮助

          本资源来自成套资源

          更多精品资料

          正在打包资料,请稍候…

          预计需要约10秒钟,请勿关闭页面

          服务器繁忙,打包失败

          请联系右侧的在线客服解决

          单次下载文件已超2GB,请分批下载

          请单份下载或分批下载

          支付后60天内可免费重复下载

          我知道了
          正在提交订单

          欢迎来到教习网

          • 900万优选资源,让备课更轻松
          • 600万优选试题,支持自由组卷
          • 高质量可编辑,日均更新2000+
          • 百万教师选择,专业更值得信赖
          微信扫码注册
          qrcode
          二维码已过期
          刷新

          微信扫码,快速注册

          还可免费领教师专享福利「樊登读书VIP」

          手机号注册
          手机号码

          手机号格式错误

          手机验证码 获取验证码

          手机验证码已经成功发送,5分钟内有效

          设置密码

          6-20个字符,数字、字母或符号

          注册即视为同意教习网「注册协议」「隐私条款」
          QQ注册
          手机号注册
          微信注册

          注册成功

          下载确认

          下载需要:0 张下载券

          账户可用:0 张下载券

          立即下载

          如何免费获得下载券?

          加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

          返回
          顶部