《回归分析的基本思想及其应用研析》文字素材3(人教A版选修1-2)
展开回归分析的基本思想及其应用研析
回归分析是研究如何从样本的统计性质去推测相应总体的统计性质,即如何根据样本去探求有关总体的规律性,是统计学中一种重要的方法,体现了统计的基本思想。回归分析,从所收集数据的特点,找出一条最接近的直线方程,即线性回归方程,而把其他一些不具有线性回归关系的数据用一种线性回归方程进行拟合,给出数据之间类似函数的一种关系,体现了从特殊到一般的基本思路,使对不确定关系的预报成为一种可能。
回归分析不仅体现了统计的基本思想,还提供了建立数学模型的一种基本方法,回归分析可以总结很多数学或者生产、生活中的规律,比如人的身高与体重的关系、水稻的产量与施肥量的关系等。
例1.高一·一班学生每周用于数学学习的时间x(单位:h)与数学成绩y(单位:分)之间有如下对应数据:
x | 24 | 15 | 23 | 19 | 16 | 11 | 20 | 16 | 17 | 13 |
y | 92 | 79 | 97 | 89 | 64 | 47 | 83 | 68 | 71 | 59 |
如果y与x之间具有线性相关关系,求回归直线方程.
分析:本题考查求回归直线方程的方法及回归直线的应用.可以直接代入相关公式得出回归直线方程。
解析:本题数据表中,自变量x的取值没有按从小到大排列,这更接近实际,对结论没有任何影响。从表中看出:同样是每周用16 h学数学,一位同学成绩是64分,另一位却是68分,这反映了y与x只有相关关系,没有函数关系。
列出下表,并用科学计算器进行有关计算.
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
xi | 24 | 15 | 23 | 19 | 16 | 11 | 20 | 16 | 17 | 13 |
yi | 92 | 79 | 97 | 89 | 64 | 47 | 83 | 68 | 71 | 59 |
xiyi | 2208 | 1185 | 2231 | 1691 | 1024 | 517 | 1660 | 1088 | 1207 | 767 |
=17.4,=74.9,xi2=3182, yi2=58375, xiyi=13578 |
设回归直线方程为=bx+a,
则b=, a=,
因此所求的回归直线方程是=3.53x+13.5.
评注:最小二乘估计是求回归直线方程的常用方法,通过本题的解答可以体会最小二乘估计的优越性。为了计算方便,通常将有关数据列成表格,然后借助于计算器算出各个量,进而求得回归直线方程。
(备选例1 )一个车间为了规定工时定额,需要确定加工零件所花费的时间。为此进行了10次试验,测得数据如下:
零件个数(个) | 10 | 20 | 30 | 40 | 50 | 60 | 70 | 80 | 90 | 100 |
加工时间(分) | 62 | 68 | 75 | 81 | 89 | 95 | 102 | 108 | 115 | 122 |
请判断与是否具有线性相关关系,如果与具有线性相关关系,求线性回归方程。
解析:在直角坐标系中画出数据的散点图(图略),很容易判断出散点在一条直线附近,故与具有线性相关关系。由测得的数据表可知:
,
∴ ,,
因此,所求线性回归方程为:.
例2.一机器可以按各种不同速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多寡,随机器运转的速度而变化,下列即为其试验结果:
速度(转/秒) | 每小时生产有问题物件数 |
8 | 5 |
12 | 8 |
14 | 9 |
16 | 11 |
(1)求出机器速度影响每小时生产有问题物件数的回归直线方程;
(2)若实际生产中所允许的每小时最大问题物件数为10,则机器的速度不得超过多少转/秒?
分析:把题中的量用回归分析的专用术语改写后再由回归分析的一般步骤解题.
解析:(1)用x来表示机器速度,y表示每小时生产的有问题的物件数,那么有:(x1,y1)=(8,5), (x2,y2)=(12,8), (x3,y3)=(14,9), (x4,y4)=(16,11), 则 =12.5, =8.25.
回归直线的斜率为:b==0.7286, a=-b=-0.8571.
所以所求的回归方程为=0.7286x-0.8571.
(2)根据公式=0.7286x-0.8571, 要使≤10, 即0.7286x-0.8571≤10,
∴x≤14.9013,即机器的速度不能超过14.9013转/秒.
评注:回归直线是对相关关系的一种估计关系式,通过回归直线可对某些事物的发展趋势进行预报,回归直线方程对相应的数据进行预报时,其误差反映了数据的稳定性,即预报的准确度.
(备选例2)以下资料是一位销售经理收集来的每年销售额和销售经验年数的关系:
销售经验(年) | 1 | 3 | 4 | 4 | 6 | 8 | 10 | 10 | 11 | 13 |
年销售额(千元) | 80 | 97 | 92 | 102 | 103 | 111 | 119 | 123 | 117 | 136 |
(1)依据这些数据画出散点图并作直线=78+4.2x,计算(yi-i)2;
(2)依据这些数据由最小二乘法求回归直线方程,并据此计算(yi-i)2;
(3)比较(1)和(2)中的平方和(yi-i)2的大小,谁更好一些?
解析:(1)散点图与直线=78+4.2x的图形如图所示,对x=1,3,…,13,有=82.2,90.6,94.8,
94.8,103.2,111.6,120,120,124.2,132.6, (yi-i)2=178.48.
(2)=xi=7,=108,(xi-)2=142,(xi-)(yi-)=568,
所以,b==4, a=-b=108-4×7=80,故=4x+80.
i=84,92,96,96,104,112,120,120,124,132. ∴(yi-i)2=170.
(3)比较可知,用最小二乘法求出的(yi-i)2较小,用最小二乘估计的算法优越一些。
评注:通过散点图检验两个变量是否具有线性相关关系后,再求回归方程.从散点图能看出它们有较好的线性关系.由一元线性回归方程的回归系数的最小二乘估计的计算公式进行计算. 通过本题的解答体会最小二乘估计的优越性.