一、关于时间序列分析

截面数据： 某一类指标，在同一时点上对不同个体的观察数据。
时间序列数据： 某一类指标，在不同时点上对同一个体的观察数据。

时间序列（time series）： 按时间的先后顺序排列形成的一组随机变量。
时间序列分类：

按照研究对象的多少，分为一元时间序列和多元时间序列。
按照观察时间的连续与否，分为离散时间序列和连续时间序列。
按照时间序列的统计特性，分为平稳时间序列和非平稳时间序列。

二、时间序列的基本概念

1、随机过程

随机过程（stochastic process）： 一组有序的随机变量，可以记为 $\{Y_t,t\in T\}$ 。
连续型随机过程： 若 $T$ 为连续集，则 ${Y_t\}$ 为连续型随机过程。
离散型随机过程： 若 $T$ 为离散集，则 ${Y_t\}$ 为离散型随机过程。

时间序列： 具有离散型时间指标集的随机过程，通常表示为 $\{Y_t,t=\cdots,-2,-1,0,1,2,\cdots\}$ 。
样本序列： 随机变量 $Y_t$ 在时间上的取值，也就是 ${Y_t\}$ 的一个样本，通常表示为 $\{y_t,t=\cdots,-2,-1,0,1,2,\cdots\}$ 。
时间序列与样本序列的关系： 样本序列是时间序列的一次实现。目的：揭示时间序列的性质。手段：通过样本序列的性质进行推断。

2、随机过程的分布及其特征

随机过程的分布： 设 ${Y_t\}$ 为一随机过程，

对于任意一个 $t(t\in T)$ ， $Y_t$ 为随机变量，其分布函数为： $F_{Y_t}(y)=P(Y_t\le y)$ 这一分布为随机过程 ${Y_t\}$ 的一维分布。
对于任意给定的 $t_1,t_2(t_1,t_2\in T)$ ， $Y_{t_1},Y_{t_2}$ 为随机变量，其联合分布函数为： $F_{Y_{t_1},Y_{t_2}}(y)=P(Y_{t_1}\le y_2,Y_{t_2}\le y_2)$ 这一分布为随机过程 ${Y_t\}$ 的二维分布。
对于任意给定的 $t_1,t_2,\cdots,t_n(t_1,t_2,\cdots,t_n\in T)$ ， $Y_{t_1},Y_{t_2},\cdots,Y_{t_n}$ 为随机变量，其联合分布函数为： $F_{Y_{t_1},Y_{t_2},\cdots,Y_{t_n}}(y)=P(Y_{t_1}\le y_1,Y_{t_2}\le y_2,\cdots,Y_{t_n}\le y_n)$ 这一分布为随机过程 ${Y_t\}$ 的 $n$ 维分布。

随机过程的数字特征：

均值函数： $\mu_t=E(Y_t)=\int_{-\infty}^{+\infty}ydF_{Y_t}(y)$
方差函数： $\sigma_t^2=Var(Y_t)=\int_{-\infty}^{+\infty}(y-E(Y_t))^2dF_{Y_t}(y)$
自协方差函数： $\gamma(t,k)=\gamma_{t,k}=Cov(Y_t,Y_k)=E[(Y_t-EY_t)(Y_k-EY_k)]$
自相关函数： $\rho(t,k)=\rho_{t,k}=Cor(Y_t,Y_k)=\frac{\gamma(t,k)}{\sqrt{\sigma_t^2\times\sigma_k^2}}=\frac{\gamma(t,k)}{\sigma_t\times\sigma_k}$
偏相关函数： $\phi(t,k)=\phi_{t,k}=Cor(Y_t,Y_k|Y_{k+1},\cdots,Y_{t-1})=\frac{Cov(Y_t,Y_k|Y_{k+1},\cdots,Y_{t-1})}{\sqrt{\sigma_t^2\times\sigma_k^2}}=\frac{Cov(Y_t,Y_k|Y_{k+1},\cdots,Y_{t-1})}{\sigma_t\times\sigma_k}$

自协方差和自相关系数的性质：

对称性： $\gamma(t,k)=\gamma(k,t)\quad\rho(t,k)=\rho(k,t)$
非负定性：自协方差矩阵和自相关系数阵是对称非负定矩阵。
规范性： $\rho(t,t)=1$ 且 $|\rho(t,t)|\le1$

3、几种重要的随机过程

白噪声（white noise）过程：设 ${Y_t\}$ 为随机过程，若 $E(Y_t)=0$ ， $Cov(Y_t,Y_s)=\begin{cases}\sigma^2&t=s\\0&t=s\end{cases}$ ，则称 ${Y_t\}$ 为白噪声过程，一般用 $\{\epsilon_t\}$ 来表示。
正态过程：设 ${Y_t\}$ 为随机过程，若 ${Y_t\}$ 的有限维分布都是正态分布，则称 ${Y_t\}$ 为正态过程，也称为高斯过程。
独立增量过程：设 ${Y_t\}$ 为随机过程，若对任意 $n$ 及 $t_i\in T,i=1,2,\cdots,n,t_1<t_2<\cdots<t_n$ ，随机变量 $Y_{t_2}-Y_{t_1},Y_{t_3}-Y_{t_2},\cdots,Y_{t_n}-Y_{t_{n-1}}$ 相互独立，则称 ${Y_t\}$ 为独立增量过程。
维纳过程：设 ${Y_t\}$ 为随机过程，若 ${Y_t\}$ 满足： $Y_0=0$ ； ${Y_t\}$ 为独立增量过程；对任意 $0\le s\le t,Y_t-Y_s$ 服从正态分布，则称 ${Y_t\}$ 为维纳过程，也称为布朗运动过程。

三、时间序列的主要特征

1、相关性

相关性： 一类是不同变量在同一时点上的相关（静态相关）；一类是同一变量在不同时点上的相关（动态相关）。
时间序列的相关性： 大多数时间序列存在着前后依存的关系，即自相关性，因此我们需要分析序列的动态相关。时间序列的相关性可以通过自相关函数来加以反映。

2、平稳性与非平稳性

严平稳过程： 设 ${Y_t\}$ 为随机过程，若 $F_{Y_{t_1},Y_{t_2},\cdots,Y_{t_n}}(y)=F_{Y_{t_{1+h}},Y_{t_{2+h}},\cdots,Y_{t_{n+h}}}(y)$ 对任意正整数 $n$ ，任意整数 $h$ 成立，则称 ${Y_t\}$ 为严平稳过程。
弱平稳过程： 设 ${Y_t\}$ 为随机过程， ${Y_t\}$ 的二阶矩有限，若 $E(y_t)=E(y_{t-j})=\mu$ ； $Var(y_t)=Var(y_{t-j})=\sigma^2$ ； $Cov(y_t,y_{t-s})=Cov(y_{t-j},y_{t-j-s})=\gamma_s$ 对任意正整数 $t$ ，任意整数 $j, s$ 成立,其中 $\mu,\sigma^2,\gamma_s$ 均为常数，则称 ${Y_t\}$ 为弱平稳过程。