姓名: 班级: 学号:
[摘要]:在讨论多元线性回归模型的估计时,我们强调了假定无多重共线性。然而,在实际问题的多远线性回归分析中,多重共线性的情形很多,尤其是不完全的多重共线性。下面介绍两种常用的诊断多重共线性的方法。
[关键字]:软件Eviews 多重共线性 相关系数 方差扩大因子
[引言]:
在讨论多元线性回归模型的估计时,我们强调了假定无多重共线性,即假定各个自变量之间不存在线性关系,或者说各自变量的观测值之间线性无关。然而,在实际问题的多远线性回归分析中,多重共线性的情形很多,但是完全的多重共线性并不多见,常见的情形是自变量之间存在的不完全的多重共线性。多年来,关于多重共线性的诊断及多重共线性严重程度的度量是统计学家们讨论的热点,已经提出了许多可行的判断方法,下面只主要介绍简单相关系数检验法和方差扩大因子法。 [使用方法]:
研究过程主要运用Eviews软件,计算自变量之间的相关系数,和各个自变量Xj的方差扩大因子,从而判断自变量之间是否存在严重
n的多重共线性。
(xix)(yiy)i1公式:x与y之间的相关系数: rnn22 (xx)(yy)ii i1i1 12RXj的方差扩大因子VIFj = (1R2)其中,j表示以Xj为因变
j量作对
其他自变量辅助线性回归的可决系数。 [解决问题]:
例题:经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数X2,城镇居民人均旅游花费X3,农村居民人均旅游花费X4,并以公路里程 X5和铁路里程X6作为相关基础设施的代表。为此设定了如下模型:
Yt12X2t3X3t4X4t5X5t6X6tt
下表是1994至2007年中国旅游收入及相关数据 国内旅游国内旅游城镇居民年份 农村居民人均旅游公路里程 X5(万公铁路里程X6(万公收入Y(亿人数X2(万人均旅游元) 人次) 52400 62900 63900 64400 69450 71900 74400 78400 87800 87000 110200 121200 139400 161000 花费X3(元) 414.7 464 534.1 599.8 607 614.8 678.6 708.3 739.7 684.9 731.8 737.1 766.4 906.9 花费X4 (元) 54.9 61.5 70.5 145.7 197 249.5 226.6 212.7 209.1 200 210.2 227.6 221.9 222.5 里) 111.78 115.7 118.58 122.64 127.85 135.17 140.27 169.8 176.52 180.98 187.07 193.05 345.7 358.37 里) 5.9 5.97 6.49 6.6 6.64 6.74 6.87 7.01 7.19 7.3 7.44 7.54 7.71 7.8 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7 5285.9 6229.74 7770.62 利用Eviews软件,生成Yt、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS回归,结果如下:
由此可见,该模型的估计结果为:
Yi1471.9560.04251X1.426786X5354.9821X264.432478X32.922273X4
R20.99562
t/2(nk)t0.025(146)2.31R=0.9973,可决系数很该模型0.05高,F检验值593.4168,明显显著。但是当时, ,不仅X5、X6的系数
t检验不显著,而且X6系数的符号与预期相反,这表明很可能存在严重的多重共线性。
方法一:简单相关系数检验法
利用Eviews软件,得到各因变量的相关系数矩阵(选择X2、X3、X4、X5、X6数据,点“view/correlation”)
由相关系数矩阵可以看出,两个因变量相互之间的相关系数较高,证实确实存在严重多重共 线性。
方法二:方差扩大因子法 操作方法:
首先建立辅助回归方程,命名为“eqxj”(j=2,3,4,5,6)。它以Xj为因变量,其余自变量依然是自变量的回归方程。然后在主窗口命令行输入:
scalar vifxj=1/(1-eqxj.@R2),执行后,主窗口左下角会出现叫做vifxj的新变量,双击,主窗口左下角就会出现它的值。
其中,X2,X3,X5,X6的方差扩大因子大于10,说明这几个自变量之间有一定的多重共线性的关系存在。
[小结]:多重共线性会导致参数的估计值不确定,参数估计量的方差增大,以及在对参数区间估计时,置信区间趋于变大。甚至会导致出现回归系数的正负号得不到合理的经济解释。诊断是否存在多重共线性是进一步消除多重共线性的先决条件。所以上述的两种方法,简单相关系数检验法和方差扩大因子法,都是十分常用的用于诊断多重共线性的方法。利用Eviews软件,检验起来相当快捷。
因篇幅问题不能全部显示,请点此查看更多更全内容