自回归AR模型、移动平均MA模型与自回归移动平均ARMA模型的比较分析

来源:互联网 发布:qq播放器官方下载 mac 编辑:程序博客网 时间:2024/05/22 15:30

系统中某一因素变量的时间序列数据没有确定的变化形式,也不能用时间的确定函数描述,但可以用概率统计方法寻求比较合适的随机模型近似反映其变化规律。(自变量不直接含有时间变量,但隐含时间因素)

1. 自回归AR(p)模型

(R:模型的名称 P:模型的参数)(自己影响自己,但可能存在误差,误差即没有考虑到的因素)

(1)模型形式

(εt越小越好,但不能为0:ε为0表示只受以前Y的历史的影响不受其他因素影响)
yt=φ1yt-1+φ2yt-2+……+φpyt-p+εt
式中假设:yt的变化主要与时间序列的历史数据有关,与其它因素无关;
εt不同时刻互不相关,εt与yt历史序列不相关。
式中符号:p模型的阶次,滞后的时间周期,通过实验和参数确定;
yt当前预测值,与自身过去观测值yt-1、…、yt-p是同一序列不同时刻的随机变量,相互间有线性关系,也反映时间滞后关系;
yt-1、yt-2、……、yt-p同一平稳序列过去p个时期的观测值;
φ1、φ2、……、φp自回归系数,通过计算得出的权数,表达yt依赖于过去的程度,且这种依赖关系恒定不变;
εt随机干扰误差项,是0均值、常方差σ2、独立的白噪声序列,通过估计指定的模型获得。

(2)识别条件

当k>p时,有φk=0或φk服从渐近正态分布N(0,1/n)且(|φk|>2/n1/2)的个数≤4.5%,即平稳时间序列的偏相关系数φk为p步截尾,自相关系数rk逐步衰减而不截尾,则序列是AR(p)模型。
实际中,一般AR过程的ACF函数呈单边递减或阻尼振荡,所以用PACF函数判别(从p阶开始的所有偏自相关系数均为0)。

(3)平稳条件

一阶:|φ1|<1。二阶:φ1+φ2<1、φ1-φ2<1、|φ2|<1。φ越大,自回归过程的波动影响越持久。

(4)模型意义

仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量相互独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性等造成的困难。

2.移动平均MA(q)模型

(1)模型形式

yt=εt-θ1εt-1-θ2εt-2-……-θpεt-p

(2)模型含义

用过去各个时期的随机干扰或预测误差的线性组合来表达当前预测值。
AR(p)的假设条件不满足时可以考虑用此形式。
总满足平稳条件,因其中参数θ取值对时间序列的影响没有AR模型中参数p的影响强烈,即这里较大的随机变化不会改变时间序列的方向。

(3)识别条件

当k>q时,有自相关系数rk=0或自相关系数rk服从N(0,1/n(1+2∑r2i)1/2)且(|rk|>2/n1/2(1+2∑r2i)1/2)的个数≤4.5%,即平稳时间序列的自相关系数rk为q步截尾,偏相关系数φk逐步衰减而不截尾,则序列是MA(q)模型。
实际中,一般MA过程的PACF函数呈单边递减或阻尼振荡,所以用ACF函数判别(从q阶开始的所有自相关系数均为0)。

(4)可逆条件

一阶:|θ1|<1。二阶:|θ2|<1、θ1+θ2<1。
当满足可逆条件时,MA(q)模型可以转换为AR(p)模型

3.自回归移动平均ARMA(p,q)模型

(1) 模型形式

yt=φ1yt-1+φ2yt-2+……+φpyt-p+εt-θ1εt-1-θ2εt-2-……-θpεt-p

式中符号: p和q是模型的自回归阶数和移动平均阶数;
φ和θ是不为零的待定系数;εt独立的误差项;
yt是平稳、正态、零均值的时间序列。

(2) 模型含义

使用两个多项式的比率近似一个较长的AR多项式,即其中p+q个数比AR(p)模型中阶数p小。前二种模型分别是该种模型的特例。
一个ARMA过程可能是AR与MA过程、几个AR过程、AR与ARMA过程的迭加,也可能是测度误差较大的AR过程。

(3) 识别条件

平稳时间序列的偏相关系数φk和自相关系数rk均不截尾,但较快收敛到0,则该时间序列可能是ARMA(p,q)模型。实际问题中,多数要用此模型。因此建模解模的主要工作是求解p、q和φ、θ的值,检验εt和yt的值。

(4) 模型阶数

AIC准则:最小信息准则,同时给出ARMA模型阶数和参数的最佳估计,适用于样本数据较少的问题。目的是判断预测目标的发展过程与哪一随机过程最为接近。因为只有当样本量足够大时,样本的自相关函数才非常接近母体的自相关函数。具体运用时,在规定范围内使模型阶数从低到高,分别计算AIC值,最后确定使其值最小的阶数是模型的合适阶数。
模型参数最大似然估计时AIC=(n-d)logσ2+2(p+q+2)
模型参数最小二乘估计时AIC=nlogσ2+(p+q+1)logn
式中:n为样本数,σ2为拟合残差平方和,d、p、q为参数。
其中:p、q范围上线是n较小时取n的比例,n较大时取logn的倍数。
实际应用中p、q一般不超过2。

4.自回归综合移动平均ARIMA(p,d,q)模型

(1)模型识别

平稳时间序列的偏相关系数φk和自相关系数rk均不截尾,且缓慢衰减收敛,则该时间序列可能是ARIMA(p,d,q)模型。

(2)模型含义

模型形式类似ARMA(p,q)模型,但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用ARMA(p,q)模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中d一般不超过2。
若时间序列存在周期性波动,则可按时间周期进行差分,目的是将随机误差有长久影响的时间序列变成仅有暂时影响的时间序列。
即差分处理后新序列符合ARMA(p,q)模型,原序列符合ARIMA(p,d,q)模型。

0 0
原创粉丝点击