1.2 对英国房屋价格建模并预测
除了zoo包,我们还会使用到forecast包的一些方法。如果你还没安装它,那就需要运行下面的命令来安装forecast包。
> install.packages("forecast")
接着我们运行下面的命令载入类。
> library("forecast")
首先,我们在时间序列对象zoo中存储月度房屋价格数据(来源:全英房屋抵押贷款协会)。
> hp <- read.zoo("UKHP.csv", sep = ",",
+ header = TRUE,format = "%Y-%m", FUN = as.yearmon)
参数FUN对日期列调用给定的函数(as.yearmon,表示月度数据点)。为了确认指定as.yearmon真正存储了月度数据(每个周期12个子周期),我们可以查询数据序列的频率。
> frequency(hp)
[1] 12
结果表示,一个周期(称为年)中有12个子周期(称为月)。为了深入分析,我们再次计算数据的简单收益率。
> hp_ret <- diff(hp) / lag(hp, k = -1) * 100
1.2.1 模型识别和估计
我们使用forecast包提供的auto.arima函数,在一步中同时识别最优模型并估计参数。除了收益率序列(hp_ret),函数还使用了几个参数。通过指定stationary = TRUE,我们将搜索仅仅限于平稳模型。同样地,seasonal = FALSE将搜索限定于非平稳模型。此外,我们选择模型时,选择赤池信息量来度量模型的相对质量。
> mod <- auto.arima(hp_ret, stationary = TRUE, seasonal =FALSE,
+ ic="aic")
为了确定拟合系数的值,我们可以查询模型的输出。
> mod
Series: hp_ret
ARIMA(2,0,0) with non-zero mean
Coefficients:
ar1 ar2 intercept
0.2299 0.3491 0.4345
s.e. 0.0573 0.0575 0.1519
sigma^2 estimated as 1.105: log likelihood=-390.97
AIC=789.94 AICc=790.1 BIC=804.28
根据赤池信息量准则,看起来AR(2)模型拟合数据最好。为了视觉层次的确认,我们可以使用命令pacf画出偏自相关函数。图形显示了到滞后两阶的非零偏自相关,阶数为2的AR过程看来比较合适。AR(2)模型给出了两个AR系数、截距(如果模型包含AR项,截距实际上是均值)以及相应的标准误。在下面的例子中,因为水平为5%的置信区间没有包括0,所以这些统计量都在5%的水平上显著。
> confint(mod)
2.5 % 97.5 %
ar1 0.1174881 0.3422486
ar2 0.2364347 0.4617421
intercept 0.1368785 0.7321623
如果模型包含不显著的系数,我们可以使用带有fixed参数的arima函数重新估计模型,这相当于输入元素为0和NA的向量。NA表示相应的变量系数需要估计而0表示相应的变量系数需要设置为0。
1.2.2 模型诊断检查
一个快速验证模型的方法是运行下面的命令画出时间序列的诊断图。
> tsdiag(mod)
上述命令的输出在图1-1中显示。
标准化残差看来没有表现出波动率聚集,ACF图中的残差自相关并不显著,还有自相关的Ljung-Box检验的p值看起来很高,综上所以残差独立的原假设不能被拒绝,因此模型看来良好。
为了评估模型对样本数据的拟合良好程度,我们可以画出原始的月回报(细的黑色实线)与拟合值(宽的红色点线)的对比图形。
> plot(mod$x, lty = 1, main = "UK house prices: raw data vs.
fitted + values", ylab = "Return in percent", xlab = "Date")
> lines(fitted(mod), lty = 2,lwd = 2, col = "red")
输出显示在图1-2中。
此外,我们可以计算精确性的常用度量。
> accuracy(mod)
ME RMSE MAE MPE MAPE MASE
0.00120 1.0514 0.8059 -Inf Inf 0.792980241
这个命令返回平均误差、均方误差、平均绝对误差、平均百分比误差、平均绝对值百分比误差和平均绝对比例误差。
1.2.3 预测
为了预测接下来3个月的月收益率(2013年4~6月),我们使用下面的 命令。
> predict(mod, n.ahead=3)
$pred
Apr May Jun
2013 0.5490544 0.7367277 0.5439708
$se
Apr May Jun
2013 1.051422 1.078842 1.158658
所以,我们预期在接下来的3个月中,平均房屋价格稍有增长,但标准误比较高,大约为1%。为了画出带有标准误的预测,我们可以使用下面的命令。
> plot(forecast(mod))