网络婚纱租借价格交流组

自回归模型简介之二:平稳性检验

影子大数据分析2020-03-28 08:11:01

在《使用ARIMA进行用电量建模预测》中提到在建模之前,需要对时间序列数据进行平稳性检验,下面简单介绍平稳性检验的相关知识。


平稳性检验原理

我们知道序列平稳性是进行时间序列分析的前提条件,很多人都会有疑问,为什么要满足平稳性的要求呢?在大数定理和中心定理中要求样本同分布(这里同分布等价于时间序列中的平稳性),而我们的建模过程中有很多都是建立在大数定理和中心极限定理的前提条件下的,如果它不满足,得到的许多结论都是不可靠的。以虚假回归为例,当响应变量和输入变量都平稳时,我们用t统计量检验标准化系数的显著性。而当响应变量和输入变量不平稳时,其标准化系数不再满足t分布,这时再用t检验来进行显著性分析,导致拒绝原假设的概率增加,即容易犯第一类错误,从而得出错误的结论。

平稳时间序列有两种定义:严平稳和宽平稳

  • 严平稳顾名思义,是一种条件非常苛刻的平稳性,它要求序列随着时间的推移,其统计性质保持不变。对于任意的τ,其联合概率密度函数满足:     

严平稳的条件只是理论上的存在,现实中用得比较多的是宽平稳的条件。

  • 宽平稳也叫弱平稳或者二阶平稳(均值和方差平稳),它应满足:

1、常数均值

2、常数方差

3、常数自协方差


平稳性检验方法

1、观察法

平稳就是围绕着一个常数无规律上下波动。观察法通俗的说就是通过观察序列的趋势图与相关图是否随着时间的变化呈现出某种规律,如果有规律,说明序列不平稳。所谓的规律就是时间序列经常提到的周期性因素,现实中遇到得比较多的是线性周期成分,这类周期成分可以采用差分或者移动平均来解决,而对于非线性周期成分的处理相对比较复杂,需要采用某些分解的方法。平稳的序列的自相关系数会快速衰减,自相关图和偏相关图不是拖尾就是截尾。截尾就是在某阶之后,系数快速衰减为 0 (或近乎0)。拖尾就是有一个衰减的趋势,但是不都为 0 

观察法1:原始图是否存在规律性

下图为航空数据的线性图,可以明显的看出它具有年周期成分和长期趋势成分。

观察法2:自相关和偏相关图,默认阶数为31阶

上面的自相关图没有截尾也没有拖尾,所以我们有理由相信该序列是不平稳的。

 

2、单位根检验

ADF是一种常用的单位根检验方法,他的原假设为序列具有单位根,即非平稳,对于一个平稳的时序数据,就需要在给定的置信水平上显著,拒绝原假设。ADF只是单位根检验的方法之一,如果想采用其他检验方法,可以安装第三方包arch,里面提供了更加全面的单位根检验方法。检验结果实例:

Test Statistic值小于Critical ValueX%)时,确定在相应置信区间X上平稳。

p-value:是给定原假设为真时样本结果出现的概率,即:p-value很大时,原假设出现概率大,即序列为非平稳序列的概率很大;相反p-value很小时,可认为序列为平稳序列。上面检验结果,其p值大于0.99,说明并不能拒绝原假设。





Copyright © 网络婚纱租借价格交流组@2017