学习一篇关于MMSE的语音信号增强的算法

来源：互联网发布：php sendmail方法编辑：程序博客网时间：2024/05/22 03:55

基于高斯分布的 MMSE 语音增强算法估计

帧移：帧移后的每一帧信号都有上一帧的成分，防止两帧之间的不连续。语音信号虽然短时可以认为平稳，但是由于人说话并不是间断的，每帧之间都是相关的，加上帧移可以更好地与实际的语音相接近。

加窗：由于直接对信号（加矩形窗）截断会产生频率泄露，为了改善频率泄露的情况，加非矩形窗，一般都是加汉明窗，因为汉明窗的幅频特性是旁瓣衰减较大，主瓣峰值与第一个旁瓣峰值衰减可达40db。

频谱泄露（截断效应）：信号为无限长序列，运算需要截取其中一部分（截断），于是需要加窗函数，加了窗函数相当于时域相乘，于是相当于频域卷积，于是频谱中除了本来该有的主瓣之外，还会出现本不该有的旁瓣，这就是频谱泄露！为了减弱频谱泄露，可以采用加权的窗函数，加权的窗函数包括平顶窗、汉宁窗、高斯窗等等。而未加权的矩形窗泄露最为严重。频谱泄露就是分析结果中，出现了本来没有的频率分量。

先验信噪比：先可以是方差，一阶统计量是均值，二阶统计量方差对应能量，但是具体计算的时侯不一定非得用方差。
后验观测信号的能量（signal+noise）与noise能量的比值，当然这个noise的能量是你估计出来的，只是一个估计值。。。
就是比如你观察到的信号是 signal+ noise，此时的signal 与noise的能量比就是先验信噪比，当然一般算的是signal的估计值与noise的估计值的能量比。
当然这个值是根据你的观测矢量算出来的。那还有一个后验的信噪比，指的是观测信号与noise的能量比。

MMSE算法：

利用已经有的观测量估计估计量的取值，减小关于估计量的不确定性

估值：

利用已有的观测量的信息，

估计估计量的取值，

减小关于估计量的不确定性。

均方误差最小的估值问题

设

和

是两个随机矢量，

两者存在联合分布，

设

是观察矢量，

通过

对

进行

估值，求均方误差最小的估值ξ。

{

}

)

(

−

⎭

⎬

⎫

⎩

⎨

⎧

−

min

，其中

(

)

，……，

为任意矢量。

0 0