本篇博文主要介绍如何用ARIMA模型来对股票数据做时序预测。
获取数据
这里用的是tushare库,得到万科股票半年的数据。
import tushare as t1
t1.set_token('你自己的token')
ts=t1.pro_api()
df = ts.get_k_data('000002',start='2021-09-01',end='2021-12-31')#查万科两个月的历史行情
print(df)
观察原始数据的时序图和acf图:
df = df.dropna()
df = df["close"]
df.reset_index()
plt.plot(np.arange(81),df)
plt.title("时序图") #添加图标题
plt.xticks(rotation=45) #横坐标旋转45度
plt.xlabel('date') #添加图的标签(x轴,y轴)
plt.ylabel("close")
from statsmodels.graphics.tsaplots import plot_acf
plot_acf(df,lags=30)
plt.show()
观察可得,数据不是平稳序列,接下来对数据进行简单的处理,使其变为平稳序列。
数据预处理
这块对数据做的处理是对数据进行一阶差分:
# 进行一阶差分
D_ts1 = df.diff().dropna()
D_ts1.columns = [u'close差分']
做完差分后,观察其时序图和acf、pacf图: 看起来感觉还可以,接下来用ADF检验来判断差分后的序列是否为平稳序列:
from arch.unitroot import ADF
adf = ADF(D_ts1)
# print(adf.pvalue)
print(adf.summary().as_text())
根据结果,可得到一阶差分后的序列为平稳序列。
模型识别
确定阶数的这一块是利用AIC和BIC,代码我就不放了 画出来的热力图是这样的,可得p=3,q=3
假设检验
拟合模型:
from statsmodels.tsa.arima_model import ARIMA
model = ARIMA(df, order=(3,1,3))
model_fit = model.fit()
model_fit.summary()
这里利用QQ图(利用QQ图检验残差是否满足正态分布)和DW(利用D-W检验,检验残差的自相关性)进行检验:
from statsmodels.graphics.api import qqplot
from statsmodels.stats.stattools import durbin_watson #DW检验
resid = model_fit.resid
plt.figure(figsize=(12,8))
qqplot(resid,line='q',fit=True)
print('D-W检验值为{}'.format(durbin_watson(resid.values)))
Out:
D-W检验值为2.000610162178381
说明模型还可以。
模型预测
预测模型使用predict 函数就可以了。
|