关于Dither

来源：互联网发布：用java编写的游戏编辑：程序博客网时间：2024/06/05 03:07

　　Dither：是数字音乐处理上非常神奇的技巧，目的是通过用少数的Bit达到与较多Bit同样的听觉效果，方法是在最后一个Bit（LSB）上动“手脚”。例如用16Bit记录听起来好似20Bit的信息，听到原先16Bit无法记录的微小信息。举例来说，现在我有个20Bit的采样信息，现在想将其存为16Bit的信息格式，最简单的转换方式就是直接把后面4个Bit去掉，但是这样就失去用20Bit录音／混音的意义。比较技巧性的方法是在第17~20Bit中加入一些噪音，这段噪音就叫做Dither。这些噪音加入后，可能会进位而改变第16个Bit的信息，然后我们再把最后4个Bit删掉，这个过程我们称为redithering，用意是让后面4个Bit的数据线性地反映在第16个Bit上。由于人耳具有轻易将噪音与乐音分离的能力，所以虽然我们加入了噪音，实际上我们却听到了更多音乐的细节。　　
　　我们通过一个比喻来让大家了解Dither：我们通过手指间的细缝只能看到眼前部分的图像，但是如果前后挥动手掌，就可以通过不同时刻看到的整个图像的各个部份，从而在大脑中建构出完整的图形信息，这就是大脑神奇的地方。Dither与此类似，但不是简单的理论就可以说得清楚的。在众多的Dither技术中，索尼（SONY）公司的SBM（Super Bit Mapping，超级数码映像）、LIVE STUDIO RECORDINGS的ULTRA MATRIX PROCESSING（超级矩阵处理）都是专攻20Bit转16Bit的技术。Dither的数字音讯处理用途非常广泛，凡是两个波形的相加、振幅的缩放、Normalize都会用到。现在的录音室已经发展到24Bit录音，在这个音乐CD还是主流储存媒体的时代，Dither还是非常重要的技术。顺便提一下，在影像处理领域，将24Bit的全彩图像以16Bit的高彩画面显示也会用到Dither的技术。

为什么要使用dither？这里引用dearhoney论坛上的文章：
人耳对具有周期性的声音、频谱上特别突出的频率（formant）、随时间变化而移动的突出频率特别敏感。当声音从高解析度降低为低解析度的时候，舍弃末尾 bit 所造成增加的 quantization error，会和原本的声音讯号有高度的关连性;，会造成很明显的泛音失真，人耳对这种突出的泛音失真会很敏感。
dither 在音讯中加入所造成的是一种 white noise，也就是能量在各个频率都一样的 noise。这种 noise 是随机的、乱序的、不规则的，我们对这种讯号，大脑会认为这是比较不重要的、没有意义的、无法 tracking 的，所以会自动降低对它的敏感度，直接把它忽视掉。
所以我们就利用这样的特性，在由高解析度转为低解析度之前，先对原始的声音讯号加入一个随机的杂讯，这个杂讯会增加整体的杂讯量，但是会不规则打破原本的 quantization error，消除 quantization error 和原本讯号之间的关连也就是用我们比较可以忍受、比较不会去注意到的沙沙沙的white noise，去取代原本突出的泛音失真。

Dither(抖动)的意义

高质量的数字音频系统必须具有大的动态范围。也就是说，它们必须能够忠实地重现非常大和非常小的声音，如音乐所要求的那样。在数字音频应用中，动态范围定义为：

动态范围=20log（最大信号值/能够从噪音中分辨出来的最小信号值）

动态范围主要取决于数字系统所采用的比特数，然而，可以采取其它一些能够进一步扩展数字音频系统的响应能力的技术，这其中就有抖动和压扩。本文主要介绍抖动。

在量化过程中，每一个模拟采样必须映射到与它最接近的可用的数字电平。一个适当党校的信号能够以合理的精度捕捉到，但是小信号有可能完全丢失。抖动（Dither）通过另一种策略来改善这种情况，即采样之前在模拟信号上加上少量的百噪音。噪音的频谱是平坦的。量化后，信号的形状具有新的奇妙的特性。信号的原始形状可以通过计算这些点的滑动平均恢复。这样，信号在量化电平附近的变化就变得更明显，更多的信号原始特征被保留了下来。对于那些幅度小于一个量化步长的小信号来说，这种作用尤其有益，否则信号有可能完全丢失。

抖动还有另一个好处。对于大多数信号，量化误差被假定是随机的，并且独立于被编码的信号。这种假设导致量化噪音幅度的根均方（rms）值为Q/根下12，Q代表量化步长。遗憾的是，正弦输入的量化误差与信号并不是独立的，实际是以相同的周期变化的。结果在已量化的信号中就会出现与输入信号的谐波相联系的失真。当在正弦信号上加入抖动后，量化噪音就被随机化了，但这要求抖动噪音的根均方幅度最好为Q/根下12才能得到这种效果。抖动的加入使噪音至少增加了一倍，也就意味着总信噪比改变了10log(1/2）=-3dB。加上抖动后，信噪比降低为6.02N-1.24dB。尽管如此，其优点在于，在整个奈奎斯特频带内噪音频谱是平坦的，对于重要信号谐波的平均影响较小。