《An Introduction to Signal Smoothing》译文

来源:互联网 发布:informix 默认端口 编辑:程序博客网 时间:2024/06/02 02:12

最近在做数据平滑相关的工作,正好读到该篇博客,感觉不错,就翻译了一下。原链接:An Introduction to Signal Smoothing

信号平滑简介

噪声无处不在,不管是在采集手机游戏的加速度数据还是在测量房间的温度,都会引入误差。即使我们有能力消除所有的误差,测量的结果依旧包含一定程度的不确定性。假如玩家随意点击了一下手机屏幕,他们到底想点击哪里是不确定的。所有这些问题都强迫我们重新思考数据的采集和预处理。

1. 简介

滤波器是寻找产生观测数据最可能信号的数学工具。它可以对渗透进传感器的噪声和不确定性进行消除。当前的各种设备,如触屏、游戏手柄、手机和游戏控制器等都是通过传感器采集用户的输入,所以这些设备都不可避免地会引入噪声。所以滤波器在用户体验上扮演着非常重要的角色。
本博客会介绍关于平滑滤波器的基本知识。将这些知识应用到游戏中会极大提升游戏体验。

2. 噪声信号

用一个简单例子来解释噪声是如何干扰信号的。假设一个传感器每隔固定时间采样一下数据,在时刻i产生观测值Si。如果你是游戏开发者,这个传感器很可能是一个控制器,得到的数据可能为:Input.GetAxis("Vertical")。如果你是一个电子工程师,这个传感器可能是电位计,用来测量电压: analogRead(3)。这些时间序列都有一个共同点:都被噪声干扰。下图展示了一个被噪声污染的信号:

在这个例子中,噪声被人工添加到原始信号中。针对原始信号的每一个点Si加上一个随机值:

ni=Si+rand()

如果满足上面的条件,我们就说噪声是满足可加性的,并且是均匀分布的。这时添加的噪声就独立于原始信号。满足可加性的一致性噪声通常来源于固定的外部干扰。

3. 滑动平均(Moving Average)

是否能重构被噪声污染的信号呢?答案是:看情况。这依赖于噪声的类型和幅度。减弱噪声的最简单方法被称为滑动平均。该方法基于这样一个假设:独立的噪声不会改变信号的基本结构。如果假设成立,则求几个连续点的平均值就可以减弱噪声。正如其名字所表示的,滑动平均就是求给定点和其邻居的平均值作为信号值。例如,我们对三个点求平均值,则过滤之后的信号为:

Fi=Ni1+Ni+Ni+13

当获得所有的观测值之后,我们可以定义窗口大小为N=2K+1的滑动平均为:
Fi=1Nj=k+kSij

在下图中,用窗口大小为6的滑动平均对上图的信号进行处理:

可以看出,原始信号几乎被完整地恢复出来。如果你是开发者,可以用下面的代码实现上述过滤:

public float [] MovingAverage (float [] data, int size){    float [] filter = new float [data.length];    for (int i = points/2; i < data.length-points/2; i++)    {        float mean = 0;        for (var j = -points/2; j < points/2; j++)            mean += data[i + j];        filter[i] = mean / size;    }    return filter;}

增加窗长可以进一步减弱噪声的影响,但同时也会使原始信号过度平滑。滑动平均特别适合于连续和平稳的信号。如果信号变化较为剧烈,滑动平均可能会使原始信号的变化大于噪声的消除(也即功不抵过)。

上图中,虽然滑动平均减小了信号的变化程度,但是完美地重构了信号的线性部分。当我们在处理包含可加性噪声的线性信号时,滑动平均是最好的选择。当然,上面的例子也过于理想化,在实际中很难出现。

4. 中心化的滑动平均

上面介绍的滑动平均有个限制:窗口长度N必须为奇数。这样计算的平均值就满足对称性。假如窗口长度N=2k为偶数,此时我们有两种平滑方法(假定k=2):

MAL4=Ni2+Ni1+Ni+Ni+14

MAR4=Ni1+Ni+Ni+1+Ni+24

上述两个公式都是合法的,没有特别的偏向性。所以我们可以对这两个公式求平均值,获得一个中心化的滑动平均,这通常被称为2×4MA。
2×4MA=12[14(Ni2+Ni1+Ni+Ni+1)+14(Ni1+Ni+Ni+1+Ni+2)]

=Ni28+Ni14+Ni4+Ni+14+Ni+28

上面的结果特别像以Ni为中心的滑动平均,但是和前面介绍的滑动平均还是不同的。

5. 加权滑动平均

滑动平均中每个点的权重是相同的,一个更加合理的选择是对靠近Si的点赋予更大的权重,这就是加权滑动平均:

Fi=j=k+kSijWk+j

Wj的和必须等于1。
针对加权滑动平均,可以对前面的滑动平均代码进行下面的修改:

 for (var j = -points/2; j < points/2; j++)            mean += data[i + j] * weights[j+points/2];

回过头来重看中心化的滑动平均,我们就可以说2×4MA其实就是权重为1/8,1/4,1/4,1/4,1/8的加权滑动平均。
加权的方法不可思议得有效,但是引入了更多的参数。如果你对泛函分析很了解,可能很容易将上面的操作联想到卷积操作符上。通过仔细地挑选权重可以带来很多有趣的性质,例如实现边缘检测或者高斯模糊等。
举一个边缘检测的例子,我们对一个方波执行墨西哥帽小波的卷积操作,需要做的就是将权重设置为下述函数上的点:

f(t)=(1t2)et22

然后代码修改成:

float[] kernel = new float[10];for (int i = 0; i <= kernel.length; t ++){    float t = i +4;    kernel[i] = (1-(t*t)) * Math.exp(-(t*t)/2);}

上述卷积函数可以用来进行边缘检测。如果你是一个游戏开发者,上述方法可以用来检测玩家的突然移动,这通常是运动检测的第一步。

6. 结论

本博客介绍了信号中的噪声问题以及两种解决方法。需要记住一点,没有一种方法是完美的,每个方法都有其优缺点,我们需要知道它们的适用范围。

1 0
原创粉丝点击