浅谈傅里叶变换

来源:互联网 发布:网络迷情电影 编辑:程序博客网 时间:2024/05/29 15:35

        信号(signal)经常出现在现代科学中,如果要用数学加以简单的描述,我想这样的描述应该是一个比较好的方式:信号是一个定义在一维或则多维空间上的函数。对于任何一个输入,可以得出一个确定的输出。以声音信号为例,它是一个定义在一维空间上的函数,自变量是事件,因变量是声音的强度。在进行数学处理时,关于信号最基本的问题在于它如何表示和描述。把信号理解成一个定义在时域或空域上的函数是一种很自然的表示方法,但有时候这对理解一段信号的内容来说是不够的。仍以声音信号为例,如果把声音定义为一个在时间上的一维函数,画出之后它是一段波形图,包含了这段声音的全部信息,但如果这段声音信号是一个乐曲,我们可以用乐谱表示,如果是演讲稿我们可以用文字记录,在某种意义上说这两种表达方式是等价的。那么这两种表达方式是不是应该有某种联系呢?直到十九世纪人们才意识到他们之间存在着一种对偶关系。

    1807年法国数学家傅里叶向巴黎科学院提交了一篇划时代意义的论文《固体中的热传播》,里面提到了一个概念:任何一个函数都可以表达为一系列不同频率的简谐振动的(即简单的三角函数)叠加。这个结论只是论文中的一个副产品。但经过当时著名科学家如拉格朗日、勒让德等人的审阅,由于其思想的不严密而被拒绝,四年之后经过修改的论文才被接受,但仍被拒绝发表在《报告》上,傅里叶对称耿耿于怀,直到1824年,他做了科学院的秘书才得以把当年的论文发表。

     用今天的语言来描述,傅立叶的发现实际上是在说:任何一个信号都可以用两种方式来表达,一种就是通常意义上的表达,自变量是时间或者空间的坐标,因 变量是信号在该处的强度,另一种则是把一个信号「展开」成不同频率的简单三角函数(简谐振动)的叠加,于是这就相当于把它看作是定义在所有频率所组成的空 间(称为频域空间)上的另一个函数,自变量是不同的频率,因变量是该频率所对应的简谐振动的幅度。

    这两个函数一个定义在时域(或空域)上,一个定义在频域上,看起来的样子通常截然不同,但是它们是在以完全不同的方式殊途同归地描述着同一个信号。它们就象是两种不同的语言,乍一听完全不相干,但是其实可以精确地互相翻译。在数学上,这种翻译的过程被称为「傅立叶变换」。

傅立叶变换是一个数学上极为精美的对象:

  • 它是完全可逆的,任何能量有限的时域或空域信号都存在唯一的频域表达,反之亦然。
  • 它完全不损伤信号的内在结构:任何两个信号之间有多少相关程度(即内积),它们的频域表达之间也一定有同样多的相关程度。
  • 它不改变信号之间的关联性:一组信号收敛到一个特定的极限,它们的频域表达也一定收敛到那个极限函数的频域表达。
    傅里叶变换就像是把信号彻底打乱之后以面目全非的方式表达出来,而一切的信息原封不动的存在着。在傅立叶变换的所有这些数学性质中,最不寻常的是这样一种特性:一个在时域或空域上看起来很复杂的信号(譬如一段声音或者一幅图像)通常在频域上的 表达会很简单。这里「简单」的意思是说作为频域上的函数,它只集中在很小一块区域内,而很大一部分数值都接近于零。

    这是一个意味深长的事实,它说明一个在空域中看起来占满全空间的信号,从频域中看起来很可能只不过占用了极小一块区域,而大部分频率是被浪费了的。 这就导出了一个极为有用的结论:一个看起来信息量很大的信号,其实可以只用少得多的数据来加以描述。只要对它先做傅里叶变换,然后只记录那些不接近零的频 域信息就可以了,这样数据量就可以大大减少。

    基本上,这正是今天大多数数据压缩方法的基础思想。在互联网时代,大量的多媒体信息需要在尽量节省带宽和时间的前提下被传输,所以数据压缩从来都是 最核心的问题之一。而今天几乎所有流行的数据压缩格式,无论是声音的 mp3 格式还是图像的 jpg 格式,都是利用傅立叶变换才得以发明的。从这个意义上说来,几乎全部现代信息社会都建立在傅立叶的理论的基础之上。这当然是傅立叶本人也始料未及的。

    傅立叶变换这种对偶关系的本质,是把一块信息用彻底打乱的方式重新叙述一遍。正如前面所提到的那样,一个信号可能在空域上显得内容丰富,但是当它在 频域上被重新表达出来的时候,往往就在大多数区域接近于零。反过来这个关系也是对称的:一个空域上大多数区域接近于零的信号,在频域上通常都会占据绝大多 数频率。

    有没有一种信号在空域和频域上的分布都很广泛呢?有的,最简单的例子就是噪声信号。一段纯粹的白噪声,其傅立叶变换也仍然是噪声,所以它在空域和频 域上的分布都是广泛的。如果用信号处理的语言来说,这就说明「噪声本身是不可压缩的」。这并不违反直觉,因为信号压缩的本质就是通过挖掘信息的结构和规律 来对它进行更简洁的描述,而噪声,顾名思义,就是没有结构和规律的信号,自然也就无从得以压缩。

     另一方面,有没有一种信号在空域和频域上的分布都很简单呢?换句话说,存不存在一个函数,它在空间上只分布在很少的几个区域内,并且在频域上也只占用了很少的几个频率呢?(零函数当然满足这个条件,所以下面讨论的都是非零函数。)答案是不存在。这就是所谓的 uncertainty principle(不确定性原理)。

    这一事实有极为重要的内涵,但是其重要性并不容易被立刻注意到。它甚至都不是很直观:大自然一定要限制一个信号在空间分布和频率分布上都不能都集中在一起,看起来并没有什么道理啊。

    这个原理可以被尽量直观地解释如下:所谓的频率,本质上反应的是一种长期的全局的趋势,所以任何一个单一的频率,一定对应于一个在时空中大范围存在的信号。反过来,任何只在很少一块时空的局部里存在的信号,都存在很多种不同的长期发展的可能性,从而无法精确推断其频率。


原创粉丝点击