[回归直线的拟合效果探究] 拟合回归直线最常用的方法是

   回归分析是对具有相关关系的两个变量进行统计分析的一种常用的方法.对于两个具有线性相关关系的变量,我们常常画出其散点图,求出它们的回归直线方程,并利用回归方程进行预报.但是对于回归直线方程的预报精度是否准确,也就是说回归直线的拟合效果如何,则是我们应该探究的问题.
   那么,如何来鉴别和比较回归直线的拟合效果呢?
  1 最小二乘法
   对于具有线性相关的变量的一组数据(xi,yi)(i=1、2、3、…、n),我们可用点(xi,yi)与回归直线y∧=b∧x+a∧上横坐标为xi的点之间的距离来刻画点(xi,yi)到直线的远近.即用|yi-(bxi+a)|(i=1、2、3、…、n)表示点(xi,yi)到直线的远近,如上图.这样,用这n个距离之和来刻画各点与此直线的“整体距离”是比较合适的.即用∑ni=1|yi-(bxi+a)|表示各点到直线y=bx+a的“整体距离”.由于绝对值使得计算不方便,在实际应用中人们更喜欢用Q=∑ni=1(yi-bxi-a)2.显然,当Q 越小,各点到直线的“整体距离”越近,则回归直线的拟合效果就越好.
  2 残差图法
   针对回归直线y∧=b∧x+a∧,对于每个xi所对的yi∧与样本点(xi,yi)中的yi,它们之间存在误差.我们将ei∧=yi-yi∧=yi-b∧xi-a∧,(i=1、2、…、n)称为相应于点(xi,yi)的残差.我们利用图形来分析残差.作图时纵坐标为残差,横坐标可以选为样本编号等.在残差图中,若残差点比较均匀地落在水平的带状区域中,且带状区域的宽度越窄,说明回归直线的拟合精度越高.
  3 用R2来刻画回归方程的拟合效果
   在线性回归模型中,R2表示解释变量对于预报变量的贡献率.其计算公式是:R2=1-∑ni=1(yi-y∧i)2∑ni=1(yi-)2.R2越接近于1,表示回归效果越好.对于已知的样本数据,该公式中的分母∑ni=1(yi-)2是一个确定的数,而分子∑ni=1(yi-yi∧)2=∑ni=1ei∧即为残差平方和.我们可发现∑ni=1(yi-yi∧)2=∑ni=1(yi-b∧xi-a∧)2,这与最小二乘法中的Q相同,故Q即为残差平方和.显然,当残差平方和越小,则R2越大,意味着模型的拟合效果越好.当残差平方和越大,则R2越小,模型的拟合效果越差.事实上,R2恰好等于相关系数r的平方,推导如下:
   R2=1-∑ni=1(yi-y∧i)2∑ni=1(yi-)2
   =∑ni=1(y∧i-)2∑ni=1(yi-)2
   =∑ni=1(b∧•xi+a∧-)2∑ni=1(yi-)2
   =∑ni=1(b∧•xi+-b∧•-)2∑ni=1(yi-)2
   =∑ni=1(b∧•xi-b∧•)2∑ni=1(yi-)2
   =b∧2•∑ni=1(xi-)2∑ni=1(yi-)2
   =∑ni=1(xi-)•(yi-)∑ni=1(xi-)22•∑ni=1(xi-)2∑ni=1(yi-)2
   =(∑ni=1(xi-)•(yi-))2∑ni=1(xi-)2•∑ni=1(yi-)2
   =r2
   在线性回归模型中有0≤R2≤1,R2和两个变量的相关系数r都能刻画用线性回归模型拟合数据的效果.相关系数的绝对值越大,R2就越大,拟合效果就越好.
   从以上探究可知,最小二乘法中的Q、残差平方和∑ni=1ei∧、以及R2和相关系数r,它们在分析回归直线的拟合效果上具有一致性,它们是相通的.
   例题 已知x、y之间的一组数据如下表:
   对于表中数据,甲、乙两同学给出的拟合直线分别为y=13x+1和y=12x+12,试判断哪条直线的拟合精度更好.
   法一:用y=13x+1和y=12x+12作拟合直线时,由ei∧=yi-yi∧=yi-b∧xi-a∧计算残差值e∧1和e∧2如下表:
   分别作出残差图如下:
   比较两者的残差图,易发现直线y=13x+1的残差点的分布相比直线y=12x+12的残差点的分布要分散,其带状区域的宽度要宽一些,说明直线y=12x+12的拟合精度更好.
   法二 由最小二乘法,用y=13x+1作为拟合直线时,y的实际值与由直线所得的预报值的差的平方和为
   Q1=∑5i=1(yi-y∧i)2=(1-43)2+(2-2)2+(3-3)2+(4-103)2+(5-113)2=73.
   用y=12x+12作为拟合直线时,y的实际值与由直线所得的预报值的差的平方和为
   Q2=∑5i=1(yi-y∧i)2=(1-1)2+(2-2)2+(3-72)2+(4-4)2+(5-92)2=12
   因为Q1>Q2,所以直线y=12x+12的拟合精度更好.
   法三 用R2来刻画回归方程的拟合效果,由数据表知=3,故∑5i=1(yi-)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10
   由R2=1-∑ni=1(yi-y∧i)2∑ni=1(yi-)2计算,当以直线y=13x+1作为拟合直线时,R21=1-7310=2330.
   当以直线y=12x+12作为拟合直线时,R22=1-1210=1920.由于R21

推荐访问:拟合 探究 直线 回归直线的拟合效果探究 拟合优度r2的计算公式 拟合优度多少算好