注意:完全多重共线性;复共线性
完全不想关的变量很少见,当他们之间的相关性较弱时就可以看作是复合多元线性回归矩阵的设计要求。
1、经济问题涉及时间序列
2、截面数据建立的回归方程(截面数据(cross-section data)是指在同一时间(时期或时点)截面上反映一个总体的一批(或全部)个体的同一特征变量的观测值 [1] ,是样本数据中的常见类型之一。例如,工业普查数据,人口普查数据,家庭收入调查数据。)
3、采集的样本量小于自变量的个数也会导致多重共线性(罕见病的研究)
4、模型中引入滞后变量也是可能造成多重共线性
一般是存在近似多重共线性!完全多重共线性比较少见!、
总结在这里,下方有证明!
这样,虽然可以得到的 无偏估计,但是估计值的方差很大,不能正确判断解释变量对被解释变量的影响程度,甚至导致估计量的经济意义无法解释。
以二元回归方程为例子:
2.4_二元线性回归模型及参数估计 - 百度文库 (baidu.com)
因为变大,所以置信区间也变大了。
下边的那个统计量写错了。
原因:多重共线性相当于多了自变量,自变量增多会导致残差平方和变小,进而导致决定系数变大。因此可能会出现决定系数较大的情况
OLS最小二乘法!
多重共线性导致参数的方差变得很大,数据稍微变动可能会对系数造成较大的影响
符号可能产生逆转!
问一下老师吧??????为什么除的那一步呢!????
可以参考上方6.3.1 (2)的二元回归的形式!
小于容忍度时直接拒绝该变量加入方程哦!!!
当分析的是二元回归的情况时:
对矩阵求特征根,如果存在多重共线性,一定会有0特征根,有多少个零特征根就有多少个多重线性关系。
【1】特征根近似为0的判断标准
用条件数
最大的特征根,比待测特征根大很多倍时说明待测特征值太小了!!!
回归方程不正常!@!
通过逐步回归法,在上一节中有介绍到!
比如岭回归!