语音与噪声特点

来源:互联网 发布:微信派单系统源码下载 编辑:程序博客网 时间:2024/06/02 07:30

前言:本文参考了网上的一些资料和论述,在此表示感谢!

语音信号特征

语音信号是非平稳的。人类发声过程中口腔肌肉运动的速率变化有一定的范围而且比语音信号的变化速率要小很多,因此在对语音信号进行分析处理时,一般都假定语音信号在很短(10-30ms)的时间范围内是短时平稳的,且其短时幅度谱近似服从高斯分布。

语音信号按照发音的机理不同可大概分为两类,即浊音和清音。在发浊音时,人的声带会发生振动,信号会随着声带的振动在时域上表现出周期性的变化,在频谱分析图中则会出现共振峰结构,可以看出信号能量主要集中在低频带。在清音发声过程中则恰恰相反,人的发声带并不发生振动,信号特征与白噪声比较类似,在时域和频域中没有明显的特征。因此,对噪声和清音的分离比较难。

噪声特征及其分类

噪声是指一切干扰人们休息、学习和工作的声音,即人们不需要的声音。此外,杂乱的振幅和频率,断续或统计上无规律的声振动也称为噪声。噪声来源于实际的应用环境,因而其特性复杂。对噪声进行划分的标准很多,各种分类方法分析角度不同。

根据噪声对语音频谱的干扰方式不同,可以把噪声主要分为加性噪声和乘性噪声。

1)加性噪声

加性噪声是指当噪声对语音的干扰表现为两者信号在时域进行相加时,该噪声被称为加性噪声,显然噪声和语音在频域也为相加关系。

在实际环境中背景噪声可以看作加性噪声,如风扇的声音、汽车引擎声、周围人说话声等等。加性噪声是对背景噪声一种比较贴切的表述。麦克风等声音采集设备在正常工作的范围内可以近似看成是一个线性系统,即产生信号的幅度和声强成正比。从能量角度看背景噪声和语音的声强是相加关系,因此两者对麦克风共同作用所形成的含噪语音的信号等于各自形成的信号之和。严格说来背景噪声和语音不可避免存在非线性作用,但其不是含噪语音的主要成分。由于背景噪声的广泛存在性,因此针对这类噪声的研究成为语音增强领域里的一个重点,本书主要研究的也是加性噪声。

 2)乘性噪声

乘性噪声是指噪声和语音在频域是相乘的关系,在时域和语音则是卷积的关系,因此也称为卷积噪声。在实际应用中乘性噪声主要体现在语音采集中、麦克风传输中电话信道和无线信道的频率选择特性。乘性噪声可以通过某种变换如同态滤波,转变为加性噪声,从而可以用加性噪声的方法来处理乘性噪声。

 根据噪声统计特性随时间变化的程度可以将噪声分为周期噪声、脉冲噪声、缓变噪声、平稳噪声和宽带噪声。

1)周期噪声

发动机产生的干扰、市电干扰都是周期噪声。它的特点是在频域上具有许多离散的线谱。这种周期性噪声可以用梳状滤波器加以滤除,用数字信号处理的方法来实现。然而,实际环境中产生的周期性噪声并非简单地只含线谱分量,而是由许多窄谱组成。而且往往是时变的,并与语音信号频谱重叠,必须采用自适应滤波的方法才有可能自动识别和区分噪声。

2)脉冲噪声

打火、放电都会引起脉冲噪声。脉冲噪声表现为时域波形中出现的窄脉冲。只要脉冲噪声不是太密,一般容易用内插法来去掉这种噪声。

3)缓变噪声

缓变噪声是在实际场合经常遇到的噪声,这种噪声的统计特性会随时间缓慢变化。人群噪声是典型的缓变噪声。

4)平稳噪声

平稳噪声是指噪声的统计特性不随时间发生变化。由于噪声源的复杂性,在日常生活中所遇到的噪声大多不是平稳的,但对平稳噪声的研究确是重要的基础。

按照噪声覆盖频率范围可将噪声分为全频带噪声和窄带噪声。

1)全频带噪声

覆盖了信号的全部频率带的噪声称为全频带噪声。它的来源有很多种,如热噪声、气流如风、呼吸噪声、量化噪声以及各种随机噪声源。对于平稳的全频带噪声通常可以认为是高斯白噪声;对不具有白色频谱的噪声,可以先进行白化处理转化为白噪声。

2)窄带噪声

只覆盖信号的部分频率带的噪声称为窄带噪声,又称带选噪声。“口哨”噪声就是一种带选噪声。

 此外,还有不同学科领域研究的噪声类型:如振动噪声、环境噪声、声噪声、航空噪声、建筑噪声、电磁噪声、光学噪声等;以产生噪声的来源物体而命名的噪声类型包括:机器噪声、发动机噪声、风扇噪声、飞机噪声、天电噪声、太阳噪声、宇宙噪声、生物噪声、电子噪声等。

在语音增强系统中常见的噪声有:高斯白噪声、粉红噪声和工厂噪声。三者都是加性噪声,但不同的是工厂噪声是一种非平稳噪声,存在一段尖锐的类似脉冲噪声的噪声,而高斯白噪声和粉红噪声是平稳噪声。粉红噪声是指用正比于频率的频带带宽测量时,频谱连续且均匀的信号。在线性频率坐标下,其功率谱密度以-3dB/oct的速度下降。粉红噪声是通过对一般电子设备方便产生的白噪声进行滤波后获得的,这种滤波器称为粉红噪声滤波器。 

1)白噪声

白噪声(whitenoise)是高质量的模拟噪声发生器获得的,是指功率谱密度在整个频率内均匀分布的噪声。所以频率具有相同能量的随机噪声称为白噪声。

2)粉红噪声

粉红噪声(pinknoise)定义为在与频带中心频率成正比的带宽(如倍频程带宽)内具有相等功率的噪声或振动,是由高质量的模拟噪声发生器获得的。粉红噪声的频带分量功率主要分布在中低频段。从波形角度,粉红噪声是分形的,在一定的范围内音频数据具有相同或类似的能量。从功率的角度来看,粉红噪声的能量从低频向高频不断衰减,曲线为1/f,通常在线性频率坐标下,其功率谱密度以3dB每倍频程的速率下降。

3)工厂噪声

工厂噪声(factoryfloor noise)一般是指工业设备机器在运转时产生的噪声。在noise噪声库中工厂噪声包括两种:工厂噪声1的factoryfloor noise 1,这类噪声主要在板切割及电器设备焊接附近记录;工厂车间噪声2的factoryfloor noise2,这类噪声主要在汽车生产车间记录。

0 0
原创粉丝点击