mp3解码详细过程

来源：互联网发布：c语言求最大公约数编辑：程序博客网时间：2024/05/01 13:29

PCM信号进行MP3压缩时，以1152个PCM采样值为单位，封装成具有固定长度的MP3数据帧，帧是MP3文件的最小组成单位。在解码时，利用数据帧里的信息就可以恢复出1152个PCM采样值。这1152个采样值被分为2个粒度组，每个粒度组包含576个采样值。一个MP3数据帧分为5个部分：帧头、CRC校验值、边信息、主数据、附加数据。

1 数据流的同步以及帧头信息的读取MP3数据流的同步以帧为单位，每一帧的帧头都包含同步信息。这个同步信息是连续的12比特的‘1’组成。MP3音频解码过程中的第一步就是使解码器与输入数据流同步。在启动解码器后，可以通过搜索数据流中的12比特长的同步字来完成。在取得同步以后跟着的数据就是帧头信息，包括采样率、填充位、比特率等信息。

2 主数据的读取在MP3编码过程中使用了比特池技术，所以当前帧的主数据不一定全部都在当前帧中，在解码过程中，必须结合主数据开始指针的值来确定主数据的开始位置。主数据包含的数据有缩放因子、哈夫曼数据及附加数据。这些字段在主数据中有固定的格式。

3 哈夫曼解码和反量化在MP3编码过程中，根据心理声学模型的输出，对离散余弦变换的输出样本以粒度为单位进行的量化和分配，再对量化的结果进行哈夫曼编码。量化和编码主要是通过循环迭代完成的，循环模块分为三层来描述，最高层为帧循环，它调用外层迭代循环，而外层迭代循环又调用内层迭代循环。但在解码过程中，哈夫曼解码和反量化过程是分开实现的。每个粒度组的频率线都是用不同的哈夫曼表来进行编码的，因此在解码过程中，需要采用不同的解码方法。反量化频谱过程就是基于所得到的哈夫曼解码数据，根据逆量化全缩放公式和帧边信息，对于不同的窗类型采用不同的公式以恢复576个频率线的真实值。

4 立体声处理

5 重排序和反混叠反量化过程中得出的频谱值不是按相同顺序排列的。在编码的MDCT过程中，对于长窗产生的频谱值先按子带然后按频率排列；对于短窗，产生的频谱值按子带、窗、频率的顺序排列。为了提供哈夫曼编码效率，短窗中的数据被重新排列，按照子带、频率、窗的顺序排列。解码时，重排序及时将短窗中的频谱值重新排列。同样，在编码的MDCT过程中，为了得到更好的频域特性，对长窗对应每个子带进行了去混叠处理，为了得到正确的音频信号，在解码时必须对长窗对应的子带进行混叠重建。

6 逆向离散余弦变换逆向离散余弦变换主要是使用逆向离散余弦变换的公式，对反量化得出的信号进行变换。逆向离散余弦变换的计算十分复杂，为了提高效率，可以对计算做一些优化。

7 频率反转和子带合成频率反转是对逆向离散余弦变换的输出值中的奇数号子带（0到31号子带中的1，3，5，...，31）中的奇数号样本值（每个子带中的0到17号样本值的1，3，5，...，17号样本值）进行反相处理，用来补偿编码时为提高离散余弦变换效率而进行的频率反转。子带合成滤波器将32个带宽相等的子带中的频域信号反变换成时域信号。子带合成是逆向离散余弦变换后的一个通道中32个子带的样值，经过一系列的计算还原出32个PCM数字音频信号的过程。子带合成过程先将32个子带样值进行逆向离散余弦变换，生成64个中间值，将这64个中间值转入到一个长为1024点的类似先进先出FIFO的缓存，再在这1024个值中抽取一半，构成一个512个值的矢量，再进行加窗运算，最后将加窗结果进行叠加生成32个时域输出。

1 0