线性回归方程公式_线性回归方程公式推导
数学高中:最小二乘法和线性回归方程。
1.拟合直线的最佳方法是什么?3354接近于所有的点,也就是所有点的距离之和最小。
最小二乘法可以帮助我们在线性拟合中选择“最佳”直线。需要注意的是,在用实验数据拟合时,使用的数据量直接影响拟合结果。理论上,数据越多效果越好,即估计的线性方程能更好地反映变量之间的关系。一般我们可以对样本点做散点图来确认线性相关性,然后根据回归线性系数的公式进行计算。
2.表征采样点和直线y=a bx ——之间的“距离”。
思考:这个“距离”和点到直线的距离有什么关系?
显然,这个方程的值越小,采样点和直线之间的距离就越小。
(2)为什么不直接用点到直线的距离来描述样点与直线的距离关系?
3.最小二乘法。
如果有n个点:(x 1,y 1),(x 2,y 2),(x 3,y 3),(x ^ n,y ^ n),我们用下面的表达式来描述这些点离直线y=a bx有多近:
使上述公式达到最小值的直线y=a bx就是我们要求解的直线。这种方法叫做最小二乘法.
4.线性回归方程。
,其中。
这个线性方程叫做线性回归方程,A和B是线性回归方程的系数(回归系数)。
例1、推导2个样本点的线性回归方程
有两个点A(x 1,y 1)和B(x 2,y 2),用最小二乘法推导并分析了它们的线性回归方程。
通过最小二乘法设置解:,这样从采样点到直线的“距离和”为。
因此,可以知道当。
b有一个最小值。将
代入“距离和”的公式,把它看作关于B的二次函数,再用匹配的方法,我们就可以知道:
此时,线性方程为:
设AB的中点为m,则上述线性回归方程为:
可以看出,由两个样本点导出的线性回归方程是经过这两个点的直线方程。这和我们的理解是一致的:对于两个样本点,最佳拟合直线是经过这两个点的直线。
本文用最小二乘法直接推导出具有两个样本点的线性回归方程,主要是分别研究A和B的二次函数,并用匹配法求出其最大值和所需条件。其实这个公式是通过线性回归系数计算出来的:
线性回归方程可以如下获得:
设AB的中点为m,则上述线性回归方程为:
例2、求回归直线方程
硝酸钠溶出试验中,硝酸钠在不同温度下溶于100份水中的数据如下。
画一个散点图,找出它的回归线性方程。
在解:建立一个坐标系,并绘制如下散点图:
从散点图可以看出,两组数据是线性相关的。假设回归线方程为:
通过回归系数计算公式:
可以得出b=0.87,a=67.52,回归方程为y=0.87x 67.52。
例3、综合应用
假设某一设备的使用寿命x和维修费用y(万元)有以下统计数据:
(1)求回归线性方程;(2)使用10年预计维修费用是多少?
解:(1)让回归线性方程为:
(2)将x=10代入回归线性方程可以得到y=12.38,即10年的维修费用约为12.38万元。