三种数据类型
- 横截面数据:特定的时间点对若干个体采集的样本所构成的数据集。
- 时间序列数据:同一个个体在不同时间点上所观测的数据构成的数据集。
- 面板数据:横截面数据与时间序列数据的结合,对横截面中的观测个体在时间上进行连续观测所得到的数据。
面板数据模型的基本形式:
y
i
t
=
f
(
x
1
i
t
,
x
2
i
t
,
?
?
,
x
k
i
t
)
+
u
i
t
y_{it} = f(x_{1it},x_{2it},\cdots,x_{kit}) + u_{it}
yit?=f(x1it?,x2it?,?,xkit?)+uit?
i
=
1
,
2
,
?
?
,
n
i=1,2,\cdots,n
i=1,2,?,n表示个体数量,
t
=
1
,
2
,
?
?
,
T
t=1,2,\cdots,T
t=1,2,?,T表示观测时间点,
k
k
k表解释变量的个数。
模型误差拆解:
u
i
t
=
α
i
+
λ
t
+
?
i
t
u_{it}=\alpha_i+\lambda_t + \epsilon_{it}
uit?=αi?+λt?+?it?
我们采用线性模型,并假设:
-
?
i
t
~
N
(
0
,
σ
?
2
)
\epsilon_{it}\sim N(0,\sigma^2_{\epsilon})
?it?~N(0,σ?2?)
- 不考虑时间效应
得到
y
i
t
=
α
i
+
β
1
x
1
i
t
+
β
2
x
2
i
t
+
?
+
β
k
x
k
x
t
+
?
i
t
y_{it}=\alpha_i + \beta_1x_{1it} + \beta_2x_{2it} +\cdots+ \beta_kx_{kxt}+\epsilon_{it}
yit?=αi?+β1?x1it?+β2?x2it?+?+βk?xkxt?+?it?
三种建模方式
- 混合回归模型:个体效应相同,
α
i
=
α
,
i
=
1
,
2
,
?
?
,
n
\alpha_i = \alpha,i=1,2,\cdots,n
αi?=α,i=1,2,?,n
- 固定效应模型:个体效应不同,且
α
i
,
i
=
1
,
2
,
?
?
,
n
\alpha_i,i=1,2,\cdots,n
αi?,i=1,2,?,n是常数
- 随机效应模型:
α
i
\alpha_i
αi?是随机变量
随机效应模型具有两个随机误差项
α
i
\alpha_i
αi?和
?
i
t
\epsilon_{it}
?it?,我们假设满足
E
(
α
i
)
=
α
,
α
i
=
α
+
v
i
,
v
i
E(\alpha_i) = \alpha,\alpha_i=\alpha + v_i,v_i
E(αi?)=α,αi?=α+vi?,vi?是随机变量,并对随机误差项的方差结构提出一些假设.
|