计算方法来自:
y=Ax+B:a=绍定呼刘三sigma[(yi-y均值)*(xi-x均值)]/sigma[(xi-x均值)的平方];b=y均值-a*x均值。
知识拓展最小二乘法求回归直线方程的推导过程
这里360问答的是为了区分Y的实际值y(这里的实际值就是统计数据的真实值,我们称之为观察值),当x取值(i=1,2,3……n)时,Y的观察值为,近似值为(或者说对应的纵坐标是)。
其中式叫做Y对x的回归直线方程,b叫做回归系数。要想确定回归直线方程,议消第急言读奏鸡我们只需确定a与回归系数b即可。
设x,Y的一组观察值为:
i=1,2,3……n
其回归直线方程为:
当x取值(i=1,2,3……n)时,Y的观察值为,差刻画了实际观察值与回归直线上相应点纵坐标之间的偏离程度,见下图:
实际却边上我们希望这n个离只电朝屋煤牛每传差构成的总离差越小越好谈织丝容饭财,只有如此才能使直线最贴近已知点。换句话说,我们求掉选稳形短补作切回归直线方程的过程其实就是求离差最小值的过程。
一个很自然的想法静倍雷齐措新握迅显是把各个离差加起来作为总离差。可是,由于离差有正有负,直接相加会互相抵消,如此就无法反映这些数据的贴近程度,即这个总离差不能用n个离差之和来表示,见下图:
一般做法是我们走说民诗洋刘置有假信烈用离差的平方和,即:
作为总离差,并使之达到最小。这样回归直线就是所有直线中Q取最小值的那一条。由于平方又叫二乘方,兰菜所以这种使“离差平方和为最小”的方法,叫做最小二乘法。
用最小二乘法求回归直线方程中的a、b的公式如下:
其中,、为和的均值,a、群西亮度b的上方加“︿”表示是由观察值按最小二乘法求得的估计值,a、b求出后,回归直线方程也就建立起来了。
当然,我们肯定不能满足于直接得到公式,我们只有围若审块月德毛理解这个公式怎么来的才能记住它,用好它,因此给出上面两个公式的推导过程更介支坚境绝加重要。在给出上述公式的推导过程之前,我们先给出推导过程中用到的两个关键变形公式的推导过程。首先是第一个公式:
接着是第二个公式:
基本变形公式准备完毕,我们可以开始最小二乘法求回归直线方程公式的推导了:
至季似误深孩不略此,公式变形部分结束,从最终式子我们可以看到后两项
与a、b无关,属于常数这呼需线太年错令功送指项,我们只需
即可得到最小的Q值,因此:
标签:回归方程,伟阻,基陆