如何深入理解时间序列分析中的平稳性?

来源:互联网 发布:访问美国网络 慢 编辑:程序博客网 时间:2024/05/17 18:03

来自 :http://www.zhihu.com/question/21982358

在引入ARMA模型之前,一般课本都会对时间序列的平稳性作一个描述,但是总感觉没有描述特别清晰:
1. 通常时间序列模型要求的是协方差平稳,或者弱平稳,而对强平稳介绍很少,能否从数学角度分析比较两者最大的不同在何处,具体影响哪些性质;
2. 从经济学含义或者常用的金融学领域看,如何看待经济学中的均衡与时间序列中的平稳性之间的关系和区别。

声明:本文中所有引用部分,如非特别说明,皆引自Time Series Analysis with Applications in R.

接触时间序列分析才半年,尽力回答。如果回答有误,欢迎指出。

对第一个问题,我们把它拆分成以下两个问题:

  1. Why stationary?(为何要平稳?)
  2. Why weak stationary?(为何弱平稳?)

Why stationary?(为何要平稳?)
每一个统计学问题,我们都需要对其先做一些基本假设。如在一元线性回归中(y_{i}=\beta _{0}+\beta _{1}x_{i}+\varepsilon _{i}),我们要假设:①x_{i}不相关且非随机(是固定值或当做已知)②\varepsilon _{i}独立同分布服从正态分布(均值为0,方差恒定)。

在时间序列分析中,我们考虑了很多合理可以简化问题的假设。而其中最重要的假设就是平稳。
The basic idea of stationarity is that the probability laws that govern the behavior of the process do not change over time.
平稳的基本思想是:时间序列的行为并不随时间改变

正因此,我们定义了两种平稳:
Strict stationarity: A time series {Z_{t}} is said to be strictly stationary if the joint distribution of Z_{t_{1}},Z_{t_{2}}, · · ·,Z_{t_{n}} is the same as that ofZ_{t_{1}-k},Z_{t_{2}-k}, · · · ,Z_{t_{n}-k}for all choices of natural number n, all choices of time points t_{1},t_{2}, · · · , t_{n} and all choices of time lag k.
强平稳过程:对于所有可能的n,所有可能的t_{1},t_{2}, · · · , t_{n}和所有可能的k,当Z_{t_{1}},Z_{t_{2}}, · · ·,Z_{t_{n}}的联合分布与Z_{t_{1}-k},Z_{t_{2}-k}, · · · ,Z_{t_{n}-k}相同时,我们称其强平稳。

Weak stationarity: A time series {Z_{t}} is said to be weakly (second-order, or co-variance) stationary if:
① the mean function \mu (t) is constant over time, and
② γ(t, t − k) = γ(0, k) for all times t and lags k.
弱平稳过程:当①均值函数是常数函数且②协方差函数仅与时间差相关,我们才称其为弱平稳。

此时我们转到第二个问题:Why weak stationary?(为何弱平稳?)
我们先来说说两种平稳的差别
  • 两种平稳过程并没有包含关系,即弱平稳不一定是强平稳,强平稳也不一定是弱平稳。
一方面,虽然看上去强平稳的要求好像比弱平稳强,但强平稳并不一定是弱平稳,因为其矩不一定存在
例子:{Z_{t}}独立服从柯西分布。{Z_{t}}是强平稳,但由于柯西分布期望与方差不存在,所以不是弱平稳。(之所以不存在是因为其并非绝对可积。)
另一方面,弱平稳也不一定是强平稳,因为二阶矩性质并不能确定分布的性质
例子:Z_{1}\sim N(1,1),Z_{2}\sim Exp(1),Z_{3}\sim Poi(1)互相独立。这是弱平稳却不是强平稳。

知道了这些造成差别的根本原因后,我们也可以写出两者的一些联系
  • 一阶矩和二阶矩存在时,强平稳过程是弱平稳过程。(条件可简化为二阶矩存在,因为E(X^{2})\geq E(\left| X \right| )^2
  • 当联合分布服从多元正态分布时,两平稳过程等价。(多元正态分布的二阶矩可确定分布性质)

而为什么用弱平稳而非强平稳,主要原因是:强平稳条件太强,无论是从理论上还是实际上。
理论上,证明一个时间序列是强平稳的一般很难。正如定义所说,我们要比较,对于所有可能的n,所有可能的t_{1},t_{2}, · · · , t_{n}和所有可能的k,当Z_{t_{1}},Z_{t_{2}}, · · ·,Z_{t_{n}}的联合分布与Z_{t_{1}-k},Z_{t_{2}-k}, · · · ,Z_{t_{n}-k}相同。当分布很复杂的时候,不仅很难比较所有可能性,也可能很难写出其联合分布函数。
实际上,对于数据,我们也只能估算出它们均值和二阶矩,我们没法知道它们的分布。所以我们在以后的模型构建和预测上都是在用ACF,这些性质都和弱项和性质有关。而且,教我时间序列教授说过:"General linear process(weak stationarity, linearity, causality) covers about 10% of the real data." ,如果考虑的是强平稳,我觉得可能连5%都没有了。

对第二个问题:
教授有天在审本科毕业论文,看到一个写金融的,用平稳时间序列去估计股票走势(真不知这老兄怎么想的)。当时教授就说:“金融领域很多东西之所以难以估计,就是因为其经常突变,根本就不是平稳的。
果不其然,论文最后实践阶段,对于股票选择的正确率在40%。连期望50%都不到(任意一点以后要么涨要么跌)。

暑假里自己用了一些时间序列的方法企图开发程序性交易程序。
刚开始收益率还好,越往后就越...后面直接亏损了...(软件是金字塔,第二列是利润率)

亏损的图当时没截,现在也没法补了,程序都删了。
所以应该和平稳没关系吧,毕竟我的做法也没假设是平稳的。如果平稳我就不会之后不盈利了。
(吐槽)自己果然不适合做股票、期货什么的...太高端理解不能...

以上



傅渥成,@Les Houches, France

张二喵、黄国伟、张雨木 等人赞同
我是外行,说点我的看法。

平稳不只是对很多实际过程的「简化」,还是我们的「追求」,是一条时间序列里面长期稳定不变的某些规律,是基本模型。

当面对不平稳的过程的时候,我们首先会想着去把这样的过程变换成平稳的,找出里面相对更不随时间变化的、更「平稳」的那些东西来,更平稳的序列有更低的 Order of integration 。当然,找出这些不变的(或者相对更平稳的)东西来之后,并不代表就一定可以获得真正意义上的预测能力。

举两个例子:
  1. 股票绝对价格的涨跌显然不能满足正态分布,Bachelier (1900) 当时就犯了这样的错误。当序列被 Osborne 处理过之后:\frac{S_{t}-S_{t-1}}{S_{t-1}}\approx \log S_t-\log S_{t-1},开始关注相对变化,这个序列才变得更「平稳」了。
  2. 反复做差分变换 X_t=x_{t+k}-x_t,直到时间序列变得「平稳」为止,做的差分变换的次数即为Order of integration 。一条时间序列整体随时间变化的趋势消除,因而可以关注一些在整体变化之外的那些涨落,序列也因此变得相对更「平稳」。关于差分变换直至「平稳」的一个好例子就是「抑制了房价」「抑制了房价的增长」「抑制了房价增长的势头」「抑制了房价过快增长的势头」——经过多次差分变换,直到最终「抑制……增长」,得到了一条平稳的时间序列。

关于强平稳和弱平稳的差别:
  • 强平稳是事实上的平稳(同分布);
  • 弱平稳是统计量在观测意义上的平稳(均值、方差)。

第二个问题,均衡跟稳定没有关系。
  • 国家规定了某个商品的价格,这情况完全不均衡,但是巨稳定。
  • 一般均衡达到稳定,跟时间序列的稳定性还是两码事,例如矩可能不存在;又例如我选择的时间序列的时间间隔尺度远小于市场发生响应达到稳定的均衡的时间尺度,得到的序列还是可能是不稳定的。
编辑于 2014-01-07 4 条评论       

张居营,博观厚积

张彩票、钟吕、周永 赞同

平稳性可以说是时间序列的内部逻辑性,也就是说每一期的序列值与前几期之间存在一种一致的结构性变化关系,只有这样我们才能建立模型去分析并预测。其根本原因在于统计学或者计量经济学是从数量规律的角度研究事情,如果事物本身的变化毫无规律,这时候还要用统计或计量去分析,那就毫无意义了

发布于 2014-01-08 添加评论       

王雨晨,感谢比赞同多说明什么?

云十里、张子权 赞同
只知道第一个。

一开始引进平稳,是希望能假设时间序列两个相邻点之间的分布相同,由此则可说明序列的性质不随时间改变。时间序列是随机过程的特例,两个相邻点指的是前后两个不一定独立的随机变量。

这两个随机变量的分布相同,最简单的数学表示就是他们的任意阶矩都相同,这就是强平稳。但显然强平稳没法验证,就退而要求前两阶矩平稳,即前后两个分布均值和方差是一样的。可以感觉这已经是个若得多的条件了,因为均值方差一样而分布不同的例子太多了…

那为什么弱平稳还是应用广泛呢?因为如果假设前后都是正态分布,那前两阶矩就能确定所有阶矩,则弱平稳就相当于强平稳了。

也可以反过来说,因为正态分布的这个性质,所有前两阶矩相等被定义为了弱平稳。
发布于 2013-11-08 2 条评论       

史晓斌,统计学学生

张彩票、Anlulu 赞同
以前看过一个介绍时间序列平稳性的帖子(跟楼主的问题不符),回忆如下:
假设你看到两个酒鬼(即两个随机游走序列)四处流浪,醉鬼相互不认识(即他们是独立的),所以他们的路径之间没有任何有意义的关系。但假设这两个随机游走序列是醉鬼与他的狗,这时尽管每个单独的路径仍然是一个不可预知的随机游走过程,然而醉酒和狗两者之间的距离是可预见性。例如,如果狗远离于他的主人,狗会倾向于朝他的方向移动,所以这两个随机游走序列有接近的趋势)。醉鬼和他的狗组成了一对协整序列。

如果两个非平稳的时间序列某些线性组合是平稳的,则可以说这两个序列具有协整关系。然后,我们就可以探索序列之间的长期均衡关系了。
发布于 2014-01-08 3 条评论       

李媛,爱问问题。

先验均衡何需强平稳;后验离群何谈弱平稳。道可道,非常道!

发布于 2014-01-08 添加评论       

乐乐,管理学博士 专业研究方向:营销渠道,商…

问题2:经济学中的平稳性实际也是从演化和博弈中考虑的。是指宏观概率分布的变化率在0附近小波动。不会有偏移,导致系统的转换。,此时的数学解 看来是个“鞍点”
可能这就是你指的强稳定。
发布于 2013-11-08 2 条评论       

刘军,大学生/银行从业/经济学/金融界

时间序列平稳性我是这样理解的,变量或变量间的各种意义(均值、协方差、方差)只于时间间隔有关,而与时间间隔无关的。也就是说现实生活中经济变量随着时间不表现出变化的一致性,但现实中实际的时间序列数据往往是非平稳的,经济变量表现为一致的上升或下降。平稳的时间序列你可以理解:价格围绕价值上下波动的时间变动!
发布于 2013-12-18 1 条评论       

知乎用户,不知疲倦地翻越,每一个山丘。

可以理解为一种对事实的简化。
发布于 2013-11-08 添加评论       

孔令闻,经济学、计算机网络、数学

这个问题李子奈的计量经济学相关的书籍里有很详实的解答
发布于 2013-11-09 4 条评论   

0 0
原创粉丝点击