关于Dither

来源:互联网 发布:用java编写的游戏 编辑:程序博客网 时间:2024/06/05 03:07

  Dither:是数字音乐处理上非常神奇的技巧,目的是通过用少数的Bit达到与较多Bit同样的听觉效果,方法是在最后一个Bit(LSB)上动“手脚”。例如用16Bit记录听起来好似20Bit的信息,听到原先16Bit无法记录的微小信息。举例来说,现在我有个20Bit的采样信息,现在想将其存为16Bit的信息格式,最简单的转换方式就是直接把后面4个Bit去掉,但是这样就失去用20Bit录音/混音的意义。比较技巧性的方法是在第17~20Bit中加入一些噪音,这段噪音就叫做Dither。这些噪音加入后,可能会进位而改变第16个Bit的信息,然后我们再把最后4个Bit删掉,这个过程我们称为redithering,用意是让后面4个Bit的数据线性地反映在第16个Bit上。由于人耳具有轻易将噪音与乐音分离的能力,所以虽然我们加入了噪音,实际上我们却听到了更多音乐的细节。   
  我们通过一个比喻来让大家了解Dither:我们通过手指间的细缝只能看到眼前部分的图像,但是如果前后挥动手掌,就可以通过不同时刻看到的整个图像的各个部份,从而在大脑中建构出完整的图形信息,这就是大脑神奇的地方。Dither与此类似,但不是简单的理论就可以说得清楚的。在众多的Dither技术中,索尼(SONY)公司的SBM(Super Bit Mapping,超级数码映像)、LIVE STUDIO RECORDINGS的ULTRA MATRIX PROCESSING(超级矩阵处理)都是专攻20Bit转16Bit的技术。Dither的数字音讯处理用途非常广泛,凡是两个波形的相加、振幅的缩放、Normalize都会用到。现在的录音室已经发展到24Bit录音,在这个音乐CD还是主流储存媒体的时代,Dither还是非常重要的技术。顺便提一下,在影像处理领域,将24Bit的全彩图像以16Bit的高彩画面显示也会用到Dither的技术。

 

 

为什么要使用dither?这里引用dearhoney论坛上的文章:
人耳对具有周期性的声音、频谱上特别突出的频率(formant)、随时间变化而移动的突出频率特别敏感。当声音从高解析度降低为低解析度的时候,舍弃末尾 bit 所造成增加的 quantization error,会和原本的声音讯号有高度的关连性;,会造成很明显的泛音失真,人耳对这种突出的泛音失真会很敏感。
dither 在音讯中加入所造成的是一种 white noise,也就是能量在各个频率都一样的 noise。这种 noise 是随机的、乱序的、不规则的,我们对这种讯号,大脑会认为这是比较不重要的、没有意义的、无法 tracking 的,所以会自动降低对它的敏感度,直接把它忽视掉。
所以我们就利用这样的特性,在由高解析度转为低解析度之前,先对原始的声音讯号加入一个随机的杂讯,这个杂讯会增加整体的杂讯量,但是会不规则打破原本的 quantization error,消除 quantization error 和原本讯号之间的关连也就是用我们比较可以忍受、比较不会去注意到的沙沙沙的white noise,去取代原本突出的泛音失真。

 

 

Dither(抖动)的意义

高质量的数字音频系统必须具有大的动态范围。也就是说,它们必须能够忠实地重现非常大和非常小的声音,如音乐所要求的那样。在数字音频应用中,动态范围定义为:

    

    动态范围=20log(最大信号值/能够从噪音中分辨出来的最小信号值)

    

    动态范围主要取决于数字系统所采用的比特数,然而,可以采取其它一些能够进一步扩展数字音频系统的响应能力的技术,这其中就有抖动和压扩。本文主要介绍抖动。

    

    在量化过程中,每一个模拟采样必须映射到与它最接近的可用的数字电平。一个适当党校的信号能够以合理的精度捕捉到,但是小信号有可能完全丢失。抖动(Dither)通过另一种策略来改善这种情况,即采样之前在模拟信号上加上少量的百噪音。噪音的频谱是平坦的。量化后,信号的形状具有新的奇妙的特性。信号的原始形状可以通过计算这些点的滑动平均恢复。这样,信号在量化电平附近的变化就变得更明显,更多的信号原始特征被保留了下来。对于那些幅度小于一个量化步长的小信号来说,这种作用尤其有益,否则信号有可能完全丢失。

    

    抖动还有另一个好处。对于大多数信号,量化误差被假定是随机的,并且独立于被编码的信号。这种假设导致量化噪音幅度的根均方(rms)值为Q/根下12,Q代表量化步长。遗憾的是,正弦输入的量化误差与信号并不是独立的,实际是以相同的周期变化的。结果在已量化的信号中就会出现与输入信号的谐波相联系的失真。当在正弦信号上加入抖动后,量化噪音就被随机化了,但这要求抖动噪音的根均方幅度最好为Q/根下12才能得到这种效果。抖动的加入使噪音至少增加了一倍,也就意味着总信噪比改变了10log(1/2)=-3dB。加上抖动后,信噪比降低为6.02N-1.24dB。尽管如此,其优点在于,在整个奈奎斯特频带内噪音频谱是平坦的,对于重要信号谐波的平均影响较小。

 

原创粉丝点击