时间序列分析之一:数据预处理
来源:互联网 发布:电梯优化问题 编辑:程序博客网 时间:2024/06/03 20:34
时间序列分析拾运用概率与统计的理论与方法分析随机数据序列,并建立数学模型、定阶和参数估计的学科,它主要应用在预测、控制、滤波、金融(如股票价格)等方面。
我们常见的时间序列模型是状态平稳、正态分布、独立噪声(白噪声)、无趋势的。为了保证模型的精确性,需要对数据进行平稳、正态、独立、趋势的检验,在通过检验的前提下才可进行后续处理,如果不满足上述条件,还需进行预处理,使其平稳、正态、独立、无趋势。另一方面由于数据的不确定性,需要去除虚假数据(偏差太大)和填补数据等处理。
(1)平稳性检验
平稳是说系统参数不随时间变化,包括:均值、方差是否为常数,自相关函数是否只于时间间隔有关。可采用参数检验法(分组,组间差异不应太大)和非参数检验法(游程检验,游程应适中,即样本数据出现的顺序没有趋势)进行检验。
(2)正态性检验
模型噪声需要是高斯白噪声。可采用P-P图和Q-Q图直观上进行判断,也可以采用卡方拟合优度检验正态性(落入各组的频数与理想期望接近)。
(3)独立性检验
独立的白噪声序列的自相关系数是冲激函数,则序列的自相关系数需接近冲激函数才能认为是独立的。
(4)周期性检验
分析序列中的周期性或准周期序列(如季节、星期等)。由于【a】周期序列的功率谱会产生尖峰,【b】自相关系数是连续振荡波形,【c】数据的概率密度直方图是下凸,非周期是上凸。可通过直观比较得到周期性的定性结果。
(5)趋势项检验
趋势其实就是非平稳,包括均值、方差等的趋势。对均值或方差的趋势检验可以采用分组计算,再结合游程检验的思路进行。如果有趋势,则需要先提取趋势项再去掉趋势项。对趋势项可以采取滤波器消除,而对于多项式趋势可以采用最小二乘法提取。对缓慢变化趋势可采用数据时间窗和最小二乘平滑进行处理。
(6)异常值去除
数据采集过程中可能产生虚假数据,需对奇异数据进行检测和剔除。可采用人工剔除的方式,也可用线性外推的方式剔除异常点。
参考:
【1】时间序列分析简明教程,张树京
我们常见的时间序列模型是状态平稳、正态分布、独立噪声(白噪声)、无趋势的。为了保证模型的精确性,需要对数据进行平稳、正态、独立、趋势的检验,在通过检验的前提下才可进行后续处理,如果不满足上述条件,还需进行预处理,使其平稳、正态、独立、无趋势。另一方面由于数据的不确定性,需要去除虚假数据(偏差太大)和填补数据等处理。
(1)平稳性检验
平稳是说系统参数不随时间变化,包括:均值、方差是否为常数,自相关函数是否只于时间间隔有关。可采用参数检验法(分组,组间差异不应太大)和非参数检验法(游程检验,游程应适中,即样本数据出现的顺序没有趋势)进行检验。
(2)正态性检验
模型噪声需要是高斯白噪声。可采用P-P图和Q-Q图直观上进行判断,也可以采用卡方拟合优度检验正态性(落入各组的频数与理想期望接近)。
(3)独立性检验
独立的白噪声序列的自相关系数是冲激函数,则序列的自相关系数需接近冲激函数才能认为是独立的。
(4)周期性检验
分析序列中的周期性或准周期序列(如季节、星期等)。由于【a】周期序列的功率谱会产生尖峰,【b】自相关系数是连续振荡波形,【c】数据的概率密度直方图是下凸,非周期是上凸。可通过直观比较得到周期性的定性结果。
(5)趋势项检验
趋势其实就是非平稳,包括均值、方差等的趋势。对均值或方差的趋势检验可以采用分组计算,再结合游程检验的思路进行。如果有趋势,则需要先提取趋势项再去掉趋势项。对趋势项可以采取滤波器消除,而对于多项式趋势可以采用最小二乘法提取。对缓慢变化趋势可采用数据时间窗和最小二乘平滑进行处理。
(6)异常值去除
数据采集过程中可能产生虚假数据,需对奇异数据进行检测和剔除。可采用人工剔除的方式,也可用线性外推的方式剔除异常点。
参考:
【1】时间序列分析简明教程,张树京
- 时间序列分析之一:数据预处理
- 时间序列分析之预处理(一)
- 数据分析-时间序列分析
- 数据挖掘:时间序列分析
- 时间序列分析之一次指数平滑法
- 时间序列分析之一次指数平滑法
- 时间序列分析之一次指数平滑法
- 浅析时间序列分析之一次指数平滑法
- 利用Python进行数据分析--时间序列
- 数据挖掘之 时间序列分析
- IBM Streams时间序列数据分析
- 《利用Python进行数据分析》--时间序列
- Keras学习之一:文本与序列预处理
- 《利用python做数据分析》第十章:时间序列分析
- 数据分析之数据预处理
- SVM学习之一:libsvm中的数据预处理
- 分类算法之一——数据预处理
- caret包应用之一:数据预处理
- linux中单引号、双引号、反引号的作用
- tnsnames.ora中的连接串
- 初步了解Html5,运用Html5的一些基本控件
- Android2.2 API 中文文档系列(6) —— ImageView
- Codeforces Round #137 (Div. 2)
- 时间序列分析之一:数据预处理
- shell中eval的用法
- Effective Objective-C 2.0: Item 6: Understand Properties
- Linux ALSA声卡驱动之四:Control设备的创建
- 用抽象类设计计算二维图形面积的程序,在基类TDshape中设计纯虚函数area()和printName().are()用于计算图形的几何面积,printName()用于打印输出几何图形的类名
- linux shell编程指南第十章------sed 用法介绍2
- linux学习笔记--鸟哥的linux私房菜第1章 Linux是什么
- 时间序列分析之二:基本模型
- 二进制数据流方式实现 个人头像的读取、上传、修改------善良公社项目