什么是VIF?
VIF衡量了多重共线性使相应的系数的估计值的方差的增大程度。一个系数的VIF越大,说明多重共线性增大了这个系数估计值的方差。
怎么计算VIF?
假设线性模型为
Y
=
β
0
+
β
1
X
1
+
?
+
β
p
X
p
+
e
Y=\beta_0+\beta_1X_1+\cdots+\beta_pX_p+e
Y=β0?+β1?X1?+?+βp?Xp?+e,假设要计算
β
k
\beta_k
βk?的VIF,先用其它自变量对
β
k
\beta_k
βk?进行回归,即
X
k
=
β
0
+
β
1
X
1
+
?
+
β
k
?
1
X
k
?
1
+
β
k
+
1
X
k
+
1
+
?
+
+
β
p
X
p
+
e
X_k=\beta_0+\beta_1X_1+\cdots+\beta_{k-1}X_{k-1}+\beta_{k+1}X_{k+1}+\cdots++\beta_pX_p+e
Xk?=β0?+β1?X1?+?+βk?1?Xk?1?+βk+1?Xk+1?+?++βp?Xp?+e
然后计算此模型的
R
2
R^2
R2,进而得到
V
I
F
=
1
1
?
R
2
VIF=\frac{1}{1-R^2}
VIF=1?R21?
V
I
F
VIF
VIF越大,说明
R
2
R^2
R2越大,说明模型拟合的越好,即
X
k
X_k
Xk?越有可能和其它自变量有线性相关关系
有的是VIF>10,有的是VIF>5