信源编码：压缩词典编码的实现

来源：互联网发布：excel数据左上角编辑：程序博客网时间：2024/05/02 00:07

LZW算法是1984年Terry A.Welch在字典压缩算法LZ78基础上改进的一种通用压缩算法。其较快的他说速度和对各种数据文件的良好适应性使得其很快成为LZ系列压缩算法中最优秀的算法之一。

LZW算法采用动态的建立字典的方法，依次读入原文件的字符序列，每次碰到新的连续的字符串，就在字典中加入标示，当下次再次遇到这种字符串时，就可以用字典索引序号直接代替字符串，写入压缩文件中。在这里引入两个名词: "string"，"char"；string表示前缀，char 表示新读入的字符，每个字典索引对应一对(string,char）；

比如：“ABCABC”开始时，初始化字典,索引0~255被初始化为（NULL, i）, i =0,1,...,255；让字典从索引号256开始记录,正如上面所说，为了解压时方便识别数据，每次向压缩文件中写数据时，都是12位格式，这时字典索引范围为0~4095；

1. 开始时,读入第一个字符string = A,读下一个字符char = B ；

3. 查字典(A,B),字典中没有找到，在字典索引256中记录(A,B),然后输出前缀A,更新string=char=B,再次读入字符，char=C;

4. 查字典(B,C),字典中没有找到，在字典索引257中记录(B,C),然后输出前缀B,更新string=char=C,再次读入字符，char=A;

5. 查字典(C,A),字典中没有找到，在字典索引258中记录(C,A),然后输出前缀C,更新string=char=A,再次读入字符，char=B;

6. 查字典(A,B),字典可以找到，对应索引号256，然后更新string=256,再次读入字符，char=C;

7. 查字典(256,C),字典中没有找到，在字典索引259中记录(256,C),然后输出前缀256,更新string=char=C,再次读入字符，char=NULL;

8. char = NULL ,文件结束，输出前缀C.

压缩完成后：A B C 256 C ; 字典不需要写入文件中；

上述过程概括："前缀string+字符char"在字典中不存在，加入字典，输出前缀，更新前缀=char,读入新字符char;

"前缀string+字符char"在字典中存在，更新前缀=索引号，读入新字符char;

在VS2015上对输入的test.bmp实现相应的压缩功能。

阅读全文

0 0