信源编码:压缩词典编码的实现

来源:互联网 发布:excel数据左上角 编辑:程序博客网 时间:2024/05/02 00:07

          LZW算法是1984年Terry A.Welch在字典压缩算法LZ78基础上改进的一种通用压缩算法。其较快的他说速度和对各种数据文件的良好适应性使得其很快成为LZ系列压缩算法中最优秀的算法之一。

       LZW算法采用动态的建立字典的方法,依次读入原文件的字符序列,每次碰到新的连续的字符串,就在字典中加入标示,当下次再次遇到这种字符串时,就可以用字典索引序号直接代替字符串,写入压缩文件中。在这里引入两个名词: "string","char";string表示前缀,char 表示新读入的字符,每个字典索引对应一对(string,char);

       比如:“ABCABC”开始时,初始化字典,索引0~255被初始化为(NULL, i), i =0,1,...,255;让字典从索引号256开始记录,正如上面所说,为了解压时方便识别数据,每次向压缩文件中写数据时,都是12位格式,这时字典索引范围为0~4095

     1. 开始时,读入第一个字符string = A,读下一个字符char = B ;

     3. 查字典(A,B),字典中没有找到,在字典索引256中记录(A,B),然后输出前缀A,更新string=char=B,再次读入字符,char=C;

     4. 查字典(B,C),字典中没有找到,在字典索引257中记录(B,C),然后输出前缀B,更新string=char=C,再次读入字符,char=A;

     5. 查字典(C,A),字典中没有找到,在字典索引258中记录(C,A),然后输出前缀C,更新string=char=A,再次读入字符,char=B;

     6. 查字典(A,B),字典可以找到,对应索引号256,然后更新string=256,再次读入字符,char=C;

     7. 查字典(256,C),字典中没有找到,在字典索引259中记录(256,C),然后输出前缀256,更新string=char=C,再次读入字符,char=NULL;

     8. char = NULL ,文件结束,输出前缀C.

     压缩完成后:A B C 256 C ; 字典不需要写入文件中; 

    上述过程概括:"前缀string+字符char"在字典中不存在,加入字典,输出前缀,更新前缀=char,读入新字符char;

                            "前缀string+字符char"在字典中存在,更新前缀=索引号,读入新字符char;

    在VS2015上对输入的test.bmp实现相应的压缩功能。

    

   

   

   


原创粉丝点击