波多尔地区pm10浓度的预测

来源:互联网 发布:智能网络电力仪表 编辑:程序博客网 时间:2024/05/17 05:00

为了预测波多尔地区每日pm10的平均浓度,设计出了一个基于空间的自适应性非线性状态建模系统。

这个非线性模型结构是基于测量出的pm10与其他依次污染物和气象变量的经验关系设计而出的。

一个扩展卡尔曼滤波算法用来估计提前一天的pm10浓度,扩展状态还包括模型参数和每日pm10平均浓度。

这个系统的重要特征就是它的行为方式可以适应空气污染的短期变化,因此它可以处理随时间演变的现象,不需要经常的调整。

这个方法应用于从波多尔地区的一个监测点的得到的数据。

试验结果表明这个模型可以精确地预测pm10每日平均浓度。


The application of the Extended Kalman filter explains about 70% of the variance with an absolute mean error less than 4.5mg/m3。

The approximate index of agreement value for the period covered is 0.90.


颗粒物PM特指悬浮在空气当中的固体颗粒或液滴的混合物质。在化学组成和颗粒大小方面有很多种类型。

PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物。它的直径还不到人的头发丝粗细的1/20。虽然PM2.5只是地球大气成分中含量很少的组分,但它对空气质量和能见度等有重要的影响。与较粗的大气颗粒物相比,PM2.5粒径小,富含大量的有毒、有害物质且在大气中的停留时间长、输送距离远,因而对人体健康和大气环境质量的影响更大。


PM10是能在大气中长期漂浮的悬浮物质称为飘尘。其粒径主要是小于10微米大于2.5微米的微粒。由于飘尘粒径小,能被人直接吸入呼吸道造成危害;又由于它能在大气中长期漂浮,易将污染物带到很远的地方,导致污染范围扩大,同时在大气中还可为化学反应提供反应床。因此,飘尘是从事环境科学工作者所注目的研究对象之一。

这些颗粒物质的主要来源是当地移动和固定的污染源,区域和远程运输,颗粒型物质的再次悬浮到大气中,以及高温和工业过程,以及NOx,SO2和其他气体相互作用。

标准:

2004年之前,一年中pm10平均浓度不能多于35天超过50微克每立方米,每年的平均值不能超过40微克。

2009年,一年中不能多于7天pm10浓度超过50,年平均值不超过20微克。 

空气质量管理部门需要预测每日的空气质量。预测的目的是提供信息以满足公众的需求,以使在某个特定的时间段内空气污染超标时减少暴露,



不幸的是,用确定型模型精确预测pm10浓度是最困难的,因为我们不太清楚pm10的来源,散步和消沉,以及连接他们的过程。

近来,已经尝试使用经验,半经验或者统计学方法对pm10浓度进行建模。(Perez and Reyes, 2002; Van der Wal and Janssen, 2000; Zickus et al., 2002; Kukkonen et al.,2001, 2002)。

线性卡尔曼滤波器已经用于环境事件序列的在线预测工具。(see for instanceYoung et al., 1991; Van der Waland Janssen, 2000; Ordieres et al., 2005; Schlink et al.,2005; Kurun et al., 2005; Nittis et al., 2004; Sivakumar,2005).

为了处理费平稳和变动性动力学,***发明出了一个完全同意的递归方法来对非平稳事件徐丽进行建模和预测。

这个递归方法允许状态空间预测和季节性调整的自适应性实现。

这个时变参数模型的特点是参数变化,该变化是光滑的,渐变的,和更迅速的波动的混合体。

所以,在某种程度上,这个模型可以处理带有变化性动力学和温和的非线性行为的系统。、

例如,一个基于递归卡尔曼滤波器的结构化模型给出的估计可以很好地与测量出的值相符合。

然而,如果时间序列呈现出特别不规则和不稳定的特性,线性卡尔曼滤波器就与持久性模型相差无几了,即预测出来的明天的值大约等于今天测量储量出来的值。

而pm10的形成过程,包括之前排放物,大气流动和气象学,是高度非线性化的和高度不稳定的。

这种非线性特性很难通过线性自适应滤波技术获得。


本篇论文的目标是,发明以及评估一个经验化的每日pm10平均浓度模型,该模型基于测量出的pm10和其他依次污染物以及气象变量的经验关系。

这个模型系统基于一个自适应的非线性的状态空间滤波器。滤波方程式用扩展卡尔曼滤波器解决。

这样一个系统的特点是模型参数是每日更新的,由于它的自适应机制。

这个模型的动态行为可以适应于空气污染的短期变化,开可以处理此现象的时变特性,不需要经常调整。

section2:描述收集到的数据;

section3:确定模型结构和输入变量;

section4:结果。


2,数据源

2.1 气象学和气象学数据

pm10浓度日均值受气象学状态如风速,风向和温度的影响。

例如,与高雅系统相关的威风经常会导致污染物在大气边界层堆积。

波多尔地区是沿海型气候,拥有约20小时的光照,每年930毫米的降雨量,年均温度约为13.7度。

这个城市距离大西洋50千米,响应海洋空气,海洋空气是夏天相对较热而且常,冬天较温和而且多于。

在海风条件下,风大多是西风和西北风。

地面气象数据来自法国气象局,包含小时性数据。

利用模拟大气数值进行天气预报。法国气象局的工作就是是当地天气场景精确化。

越策专家,拥有当地气候和模型限制的知识,调整模拟的结果,将其直接转换为观测到天气数据。

在小范围内,波多尔地区的天气预测还是相当准确地。

有1999年到2001,3年的数据。

数据是时间隔的,然后被转换成24小时平均值,最小值或者最大值。

我们使用测量道德气象学变量而不是预测出。所以我们需要考虑在真是的世界状态下,在预测日之前,只有测量出的数据和我们想预测出

pm10浓度的那一天的天气预报。

天气预报的准确度影响pm10预测的准确度。

显然,由于输入变量的错误造成的噪音水平越高,最后的预测质量越差。

这一点被考虑到了,通过在这个动态状态空间模型中引入额外地噪声源。

状态的协方差矩阵和观测的噪声被认为是高层设计参数。他们允许控制状态空间模型的灵活性

2.2 空气污染数据

我们的调查用到的空气污染数据来自于当地空气污染检测机构。波多尔地区有4个固定的监测站,许多移动的检测站,他们检测NO,NO2,O3,SO2,CO,和pm10.

当地空气污染检测机构准备接下来的24小时的空气污染预测,展示在18:00的空气污染公告中。

目前空气质量预测由一组专家提供。决策基于污染物浓度测量以及其他相关信息如交通和工业源。


一个快速的短期的预测过程出现了。。

达帕洛阿尔托被选为研究检测地点,因为它是典型城市的代表。

这个监测地点位于波尔多的西北角,靠近人口密集地区,不会受任何特定的污染源的影响。

空气污染测量没15分钟记录一次。使用的数据包含每小时平均测量值。

pm10浓度利用Mp101M EX分析器连续测量。操作的原则是基于被电子碰撞吸收的低能量的贝塔射线,电子的数量与密度成正比。

吸收是大量被辐射遍历的材料的相互作用,独立于物理化学本性。

一个滤带区域自动加权,在周围空气的灰尘沉积之前和之后。

在计算大量沉积灰尘中微分测量客服了过滤异质性的问题。

3年中的pm10日均浓度在图1中呈现。

各种气象和污染物变量数据都有0.2%到5%的缺失。

因为这个比例相当低,在此上的替代技术的影响的评估被认为是没有必要的。

缺失的数据项在用线性插值和自组织映射的结合中被填充。


3  输入变量的选择

预测值最低最高温度的不同呈现了与测量的PM10浓度的相对较强的关系。

pm10时序与相对湿度和太阳辐射强度的关系比较不明显;

24小时平均风向如下计算:0度代替360度;一个区的数字被这个平均方向影响。

周六周日的pm10平均浓度比较高


总之:输入变量有:NO,NO2,CO,Wind speed,wind direction,barometric pressure ,temperature,Day of the week


4、 pm10浓度建模

4.1 模型结构确定

y=y1+y2;

y1是模型的输出;y2是误差;

y2代表考虑了影响原始时间序列的其他因素如噪声,其他随机输入或者模型限制,其他的综合影响的一般随机输入。

y1是非线性动态模型的输出。

公式2中的函数式一些先行或非线性函数,u表示模型的输入变量,k是离散时间,


在非线性动态系统中最小模型结构的问题不是一个简单的任务。这个问题基本上是开放的。

在非线性系统识别中,检测模型结构或者确定哪些条款包括在模型中是很至关重要。

为了解决此问题,已经研究出了很多方法。

其中,最有效和最经常使用的模型结构检测技术是正交算法。

使用正交算法的优势是候选项的贡献被解耦,因此,模型术语的意义可以被测量,基于相应的误差减少比例。

在这个工作中,我们使用一个经验方法来选择如下的一个合适的模型结构。

探索性的多元图形显示器展示了总舵输入变量之间的关系与pm10相互作用.

图形显示可以激发各种模型结构选择的非线性泛函形式。

为了优化非线性模型,需要评估许多变量转换和术语分组。


通过针对不用的输入变量,pm10的非线性和多项式回归获得了上面的模型结构。

风速的影响用双曲正切函数建模,然后乘以第k天的输入污染物的线性结合

Day of the week 的影响用分类变量进行建模。

相比其他连续型变量,分类变量用来表示类别或离散级别的信息。

这个模型设计了13个每日自动更新的自由时变参数。

注意,严格来说,一个通用的模型结构选择方案是不可能的。因为每个城市必须研究它自己的气象学,环境和当地污染源。

这个非线性模型结构是针对场地特定的。

然而,提出的模型结构3提供了一个可以进化的和灵活的优势,在这个意义上,这个 模型性能呢个的综合评估可以通过减少或增加输入变量很容易地实现。

4.2 自适应非线性状态空间模型

定义一个可扩展的状态向量为4;


注意,一般的干扰术语y2被分解为两部分:一个影响状态方程5的动态成分w(过程噪声);一个作用于观测方程6的测量噪声v.

u和w都是稳定的白序列。。。。

最后的状态pm10就如关系式3建模,为了考虑到天气预报的精确性附加地状态干扰影响输入变量。

结果矩阵Q是23维的,Q是个对角矩阵,R是一个数值,因为仅有一个输出。。

递归估计x的问题可以规范化为一个非线性滤波问题。

根据在模型Q和测量R中的不确定性,滤波器计算出一个最优的预测状态和它的协方差矩阵,在可以得到观测值的任何时候,预测值和观测时在一个分析步骤中合并。

一个经典的解决滤波问题的方式是使用扩展卡尔曼滤波器。

最近在控制工程和信号处理文献出现了其他的替代方案。例如所谓的无气味的卡尔曼滤波器,以及由斯特林插值公式的多维扩展得到的非线性近似

本文中我们使用扩展卡尔曼滤波器,因为机械化方程很简单而且在科学中广泛使用。



EKF始于一个初始猜测值,使用过程派生物矩阵和测量函数。考虑如5,6中定义的状态空间模型,他们的状态都是被估计的。

我们现在的预测问题,要先确定一个鲜艳状态和一个协方差估计。

注意,状态方程式5,pm10变化是非线性的。但是测量方程式6在测量中是线性的,也就是说gshi pm10测量值得线性函数。

先验状态和协方差估计如条件期望被获得;



因为各种与其通常是棘手的,一些类型的近似是常用的。

EKF是基于一节泰勒线性化的。

EKF方程式在下面列出来允许读着对这个算法有一个快速的印象。

状态转化以及观测方程式5和6近似于一阶多项式。

在每个采样时间,先验更新比状态和协方差预测提前一步。



真实状态的均值和协方差的可用性是滤波器的重要特征。

在状态元素中,协方差是与其误差的一个测量值????????????

质量描述因此被包括在结果里,在估算误差怎么随时间烟花方面提供有用的见解。。



矩阵Q控制状态空间模型的灵活性。在这个应用中,噪声已经被添加到所有的状态和参数中。

通过选择矩阵Q的对角元素的值,模型的灵活性被噪声数量控制。

例如,如果在对角上的元素qi较小,模型中相应的参数就有较小的灵活性,比如说,它在更新时变化较小。

相似地,矩阵R控制测量方程式的灵活性。一般,Q和R称为“超参数”。

在递归估计算法中,有很多文献是关于超参数优化方面的。

观测走噪声为了统一化是正常的。而优化已经完成在噪声方差比率矩阵。

在这个研究中,根据之前的预测,超参数的优化已经完成,通过递归的测试不同的值和在一个测试期间评估进行不断调整。



5、结果

上面EKF算法的一个实际问题是不能收敛到一个合理的估计值,如果最初的最初的猜测是不好的,或者如果干扰太大以至于线性化不能描述pm10变化的动态性。

本研究中,最初的状态x0和它的

6、结论