文章标题

来源:互联网 发布:鸟哥 linux 编辑:程序博客网 时间:2024/06/05 04:03

一、实验原理

这里写图片描述
子带编码:将原始信号分解为若干个子频带,对其分别进行编码处理后再合成为全频带信号

时域与频域的矛盾:要感知时域的变化,就要增加时域的分辨力,但同时就会对频域的分辨力有所限制,反之亦然,因此要在两者之间找到一个协调。

1.时域分析

1.1 滤波器划分子带

1.1.1人耳听觉系统

人类听觉系统大致等效于一个在0Hz到20KHz频率范围内由25个重叠的带通滤波器组成的滤波器组。 人耳不能区分同一频带内同时发生的不同声音 ;人耳频带被称为临界频带(critical band); 500Hz以下每个临界频带的带宽大约是100Hz,从500Hz起,临界频带带宽线性增加。
这里写图片描述

1.1.2多相滤波器

Layer1每次进去32个点,分12次进入系统,按理说时域每次进去的32个点经过频域的32个子带后应该出来时域的32*32个点,但经过多相滤波器后只需出来32个点就可以表示32*32个点的内容。而Layer2每次进去96个点,每32个点为一组,共三组,因此需要后面的比例因子选择部分。
下图为多相滤波器的示意图

这里写图片描述

但该滤波器有如下缺点:
(1)等带宽的滤波器组与人类听觉系统的临界频带不对应。因为在低频区域,单个子带会覆盖多个临界频带。在这种情况下,量化比特数不能兼每个临界频带
(2)滤波器组与其逆过程不是无失真的。但滤波器组引入的误差差很小,且听不到
(3)子带间频率有混叠。滤波后的相邻子带有频率混叠现象,一个子带中的信号可以影响相邻子带的输出
2.频域分析

2.1 心理声学模型

32个等分的子带信号并不能精确地反映人耳的听觉特性。引入FFT补偿频率分辨率不足的问题。
(1)系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到。听觉阈值的大小随声音频率的改变而改变。一个人是否听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值
(2)听觉掩蔽特性。即听觉闽值电平是自适应的,会随听到的不同频率声音而发生变化
下图为频域掩蔽域随声压级变化曲线,可以看出听力阈会随声音频率而发生变化,以及不同声音频率造成的听力阈也有所不同
这里写图片描述

频域不同掩蔽类型的讨论

1.音频信号通常有较为复杂的频谱结构因此能产生掩蔽阈值的掩蔽音分量也有许多。
2.掩蔽音与被掩蔽音的组合方式有四种,即它们分别可以是乐音信号(弦信号,Tone)或窄带噪声(noise)。乐音信号和窄带噪声信号作为掩蔽音时产生的掩蔽效果有很大不同
这里写图片描述

2.2比例因子取值和编码

原创粉丝点击