g723源码详细分析-14-感知加权滤波器补充
来源:互联网 发布:张大奕淘宝店铺 编辑:程序博客网 时间:2024/04/30 12:38
在分析解码后置滤波器时
重找了一些感知加权的资料
补充一些对共振峰感知加权的理解
先来看感知加权滤波器的系统函数(itu 723文档中的式11)
10
1 - Σ a[j] * (z * γ1)^(-j)
j=1
W(z) = ------------------------------
10
1 - Σ a[j] * (z * γ2)^(-j)
j=1
这个形式可能让人迷惑,笔者做一个改造
A(z/γ1)
W(z)= -----------
A(z/γ2)
10
其中 A(z)= 1 - Σ a[j] * (z)^(-j)
j=1
输入是y[n] 残差x[n] 冲激响应h[n]
对应的z变换 y(z) x(z) h(z)
1
h(z) = --------
A(z)
可以看出,h(e^jw)也就是h(z)在单位圆上的取值,会出现10个峰起,也就是共振峰(峰起点实际就是h(z)=0时的根)
这里涉及到人的听觉心理,即人对声音信号的感知,共振峰处的能量贡献较大.
为了增强语音效果,自然希望增强共振峰频域附近的声音能量.
把A(z)改造成多因式乘积的形式
A(z) = (a1*(z^-1)+b1)(a2*(z^-1)+b2)...(a10*(z^-1)+b10)
1
h(z) = ---------------------------------------------------
(a1*(z^-1)+b1)(a2*(z^-1)+b2)...(a10*(z^-1)+b10)
将A(z/γ2)代入
1
h(z/γ2) = -------------------------------------------------------
(γ2a1*(z^-1)+b1)(γ2a2*(z^-1)+b2)...(γ2a10*(z^-1)+b10)
我们来看第一项 (γ2a1*(z^-1)+b1),它在单位圆上的取值特点,会是这样
| y轴 _
| | |
| / \
|______| |_____________
|____________________________x轴
即,大多数情况下,值很小,然后会有一个峰起,是h(z)共振峰中的第一个
显然,此γ2就起到了加强共振峰的作用,对非共振峰频域,加强的效果就很小,
对其它因子(如(γ2a2*(z^-1)+b2))的加强,也很小,但影响还是有的,所以会有后置滤波这一说.
而分子γ1,则是对γ2的一个调节.
我们先假设γ1=1,
y(z) 1
h(z) = ------ = -------
x(z) A(z)
y(z) * W(z) = y(z) * A(z) * A(z/γ2)
而y(z) * A(z) = x(z)
x(z)* A(z/γ2) 相当于,用残差去激励了一个共振峰加强的声道系统,就会起到增加音质的作用
那么γ1不等于1的情况,则是起调节γ2作用,简单地说,看下式
γ1 * x + 1
-----------
γ2 * x + 1
γ1自然能调试γ2的影响
g723于是出现了开头对信号的预处理,以此来加强共振峰
林绍川 于杭州
重找了一些感知加权的资料
补充一些对共振峰感知加权的理解
先来看感知加权滤波器的系统函数(itu 723文档中的式11)
10
1 - Σ a[j] * (z * γ1)^(-j)
j=1
W(z) = ------------------------------
10
1 - Σ a[j] * (z * γ2)^(-j)
j=1
这个形式可能让人迷惑,笔者做一个改造
A(z/γ1)
W(z)= -----------
A(z/γ2)
10
其中 A(z)= 1 - Σ a[j] * (z)^(-j)
j=1
输入是y[n] 残差x[n] 冲激响应h[n]
对应的z变换 y(z) x(z) h(z)
1
h(z) = --------
A(z)
可以看出,h(e^jw)也就是h(z)在单位圆上的取值,会出现10个峰起,也就是共振峰(峰起点实际就是h(z)=0时的根)
这里涉及到人的听觉心理,即人对声音信号的感知,共振峰处的能量贡献较大.
为了增强语音效果,自然希望增强共振峰频域附近的声音能量.
把A(z)改造成多因式乘积的形式
A(z) = (a1*(z^-1)+b1)(a2*(z^-1)+b2)...(a10*(z^-1)+b10)
1
h(z) = ---------------------------------------------------
(a1*(z^-1)+b1)(a2*(z^-1)+b2)...(a10*(z^-1)+b10)
将A(z/γ2)代入
1
h(z/γ2) = -------------------------------------------------------
(γ2a1*(z^-1)+b1)(γ2a2*(z^-1)+b2)...(γ2a10*(z^-1)+b10)
我们来看第一项 (γ2a1*(z^-1)+b1),它在单位圆上的取值特点,会是这样
| y轴 _
| | |
| / \
|______| |_____________
|____________________________x轴
即,大多数情况下,值很小,然后会有一个峰起,是h(z)共振峰中的第一个
显然,此γ2就起到了加强共振峰的作用,对非共振峰频域,加强的效果就很小,
对其它因子(如(γ2a2*(z^-1)+b2))的加强,也很小,但影响还是有的,所以会有后置滤波这一说.
而分子γ1,则是对γ2的一个调节.
我们先假设γ1=1,
y(z) 1
h(z) = ------ = -------
x(z) A(z)
y(z) * W(z) = y(z) * A(z) * A(z/γ2)
而y(z) * A(z) = x(z)
x(z)* A(z/γ2) 相当于,用残差去激励了一个共振峰加强的声道系统,就会起到增加音质的作用
那么γ1不等于1的情况,则是起调节γ2作用,简单地说,看下式
γ1 * x + 1
-----------
γ2 * x + 1
γ1自然能调试γ2的影响
g723于是出现了开头对信号的预处理,以此来加强共振峰
林绍川 于杭州
- g723源码详细分析-14-感知加权滤波器补充
- g723源码详细分析(四) 感知加权与基音周期搜索
- g723源码详细分析-19-基音后置滤波器
- g723源码详细分析-20-共振峰后置滤波器
- g723源码详细分析(-)
- g723源码详细分析(-)
- g723源码分析-(五)-基音周期补充
- g723源码详细分析(三) lsp量化
- g723源码详细分析-13-解码
- g723源码详细分析-15-静音检测
- g723源码详细分析(二) lpc转lsp
- g723源码详细分析-6-谐波噪声整形
- g723源码详细分析-9-自适应码本搜索
- g723源码详细分析-10-固定随机码本搜索
- g723源码详细分析-11-多脉码激励编码
- g723源码详细分析-12-更新内存与打包等
- g723源码详细分析-16-舒适噪声生成
- g723源码详细分析-17-舒适噪声解码
- SQL 数据库备份
- 创建VLAN的程序代码
- iphone4原理图
- 公司HR面试经常问的问题及回答思路
- 内存颗粒和模组编号知识60问
- g723源码详细分析-14-感知加权滤波器补充
- linux系统故障修复
- ADO.Net实用技巧两则
- HDU1281-棋盘游戏-二分匹配与增广链
- 简单分业(带参-适合中小型)_.net
- android window.requestWindowFeature()常用方法
- HDU1285基于有向图邻接表的优先队列的拓扑排序
- appface网站
- 生成1-100不重复的随机数