目录
多种数据类型处理方法
使用线性回归模型前,先进行预处理?
?回归系数解释
?内生性,外生性
核心变量,控制变量
??取对数
?四种模型回归系数解释
虚拟变量
?含有交互项的自变量
stata
???
?数据的描述性统计
?stata回归
?拟合优度R2太低?
?标准化回归系数
?扰动项
?异方差?
?检验异方差
?拟合出现负数原因?
?异方差假设检验
??异方差处理方法(加上推荐)
?使用OLS + 稳健的标准误
?检测多重共线性?在回归后
多重共线性 解决
?逐步回归分析
常见的回归分析有五类:线性回归、0‐1回归、定序回归、计数回归 和生存回归。
这就是回归分析要完成的三个使命:
第一、识别重要变量;
第二、判断相关性的方向;
第三、要估计权重(回归系数)

多种数据类型处理方法
宏观数据:知乎上搜“数据查找”?
微观数据:在人大经济论坛搜索 https://bbs.pinggu.org
一元线性回归

使用线性回归模型前,先进行预处理?
?excel预处理:直接=要处理的数据和指令
?回归系数解释

?内生性,外生性

?
核心变量,控制变量
?取对数

?四种模型回归系数解释

?
虚拟变量
如果自变量中有定性变量,例如性别、地域等,在回归中要?使用虚拟变量

??
为了避免完全多重共线性的影响,引入虚拟变量的个数一般是分类数减1。
?含有交互项的自变量

stata
?
?数据的描述性统计

?
?excel数据透视表(作图)

?stata回归
1)regress y x1 x2 … xk

2)标准化回归
regress y x1 x2 … xk,beta
??
?拟合优度R2太低
?标准化回归系数

?扰动项

?异方差?
检验异方差
stata?
拟合出现负数原因?
异方差假设检验
1)BP检验:Stata命令(在回归结束后使用)
estat hettest ,rhs iid
结果

2)怀特检验:Stata命令(在回归结束后使用)
estat imtest,white?
结果:与0.05对比
?异方差处理方法(加上推荐)
使用OLS + 稳健的标准误
regress y x1 x2 … xk,robust?
检测多重共线性?在回归后
estat vif

多重共线性 解决
一般还是直接删数据
逐步回归分析
向前逐步回归Forward?selection: stepwise regress y x1 x2 … xk, pe(#1)?
向后逐步回归Backward?elimination: stepwise regress y x1 x2 … xk, pr(#2)
?#1,#2表示一个数,如果是向前的话,太严格就加不进来变量 ,增大#1,就可以增加变量数目,? 如果是先后的话太严格就剔除不了变量,那基本都留下来了,可以减小#2,
 
注意 ?
|