整数压缩算法

来源:互联网 发布:搪瓷 知乎 编辑:程序博客网 时间:2024/06/05 16:54

1 0~255的整数可以只用一个字节表示,256~65535的数据只需2个字节,65536~16777215需要3个字节,16777216以上4个字节

int uncompressed[] = {...}
byte compressed[] = {...}

Encode Integers:int outPos = 0, previous = 0;for (int inPos = 0; inPos < n; inPos++) {int delta = uncompressed[inPos] - previous;while (delta >= 128) {compressed[outPos++] = (delta & 127) | 128;delta = delta >> 7;}compressed[outPos++] = delta;}Decode Integers:int outPos = 0, previous = 0;for (int outPos = 0; outPos < n; outPos++) {for (int shift = 0; ; shift += 7) {int temp = compressed[inPos++];previous += ((temp & 127) << shift);if (temp < 128) break;}uncompressed[outPos] = previous;}
2 行程压缩算法 or(游程长度压缩算法)  RLE(Run Length Encoding)

http://blog.csdn.net/orbit/article/details/7062218

这里需要补充的是在传统的RLE算法里,并没有考虑到连续递增或递减的数据序列,例如:2,3,4,5,6,8,9,10,11。2,3,4,5,6是一个增序列,9,10,11,12也是一个增序列,对应这种序列,我们可以添加一个自己的模式来处理它。例如:00b表示连续相同的数字序列, 01b表示连续递增的数字序列,那么可以用(01000101)b表示递增序列的长度为5.

3 PForDelta索引压缩算法

4 NewPForDelta算法

5 variable byte / code 算法

6 LZMA算法,(Lempel-Ziv-Markov chain-Algorithm 的缩写)

7 DEFLATE压缩算法,是同时使用了LZ77算法与哈夫曼编码(Huffman Coding)的一个无损数据压缩算法

0 0