Huffman二叉树及其代码分析

来源:互联网 发布:em253编程实例 编辑:程序博客网 时间:2024/06/07 05:49

霍夫曼编码(Huffman Coding)是可变长编码(VLC)的一种,于1952年由Huffman提出。Huffman编码属于无损压缩编码,且所编得的码为即时码,虽然编码方式不唯一,但是平均码长是确定且最短的。该编码方式广泛用于JPEG、MPEG等各种标准中。

Huffman码的原理非常简单,就是给概率大的码字分配短码,而给那些较少出现的码字分配长码。

这里以一张图做简要说明


就是一个对码字先依概率进行排序,然后构造一颗Huffman二叉树的过程。

然后对构造Huffman二叉树的C语言代码进行简要说明。

1.建立一些结构体

  1. //Huffman树结点类型  
  2. typedef struct HFNODE  
  3. {  
  4.     int w;  
  5.     struct HFNODE *lchild;  
  6.     struct HFNODE *rchild;  
  7. }HfNode;  
容易看到Huffman树的节点的结构体中有三个成员,int w ,即该节点的权重,另外两个指向该结构体的指针,分别指向左儿子和右儿子,就是指向左子树和右子树的指针。

//typedef struct HFNODE HfNode;

同理

  1. //链表结点类型  
  2. typedef struct LNODE  
  3. {  
  4.     struct LNODE *pnext;  
  5.     HfNode *proot;  
  6. }LNode; 

2.相应的函数

紧接着有个构造二叉树的函数

  1. HfNode *Huffman(int n, int *w);  
它返回一个指向节点结构体的指针,看看在这个函数里都做了什么。

 l = (LNode*)malloc(sizeof(LNode));  //创建头结点  

  1. for ( i=0; i<n; i++ ){  
  2.         hnew = (HfNode*)malloc(sizeof(HfNode));  
  3.         hnew->w = w[i];  
  4.         hnew->lchild = NULL;  
  5.         hnew->rchild = NULL;  
  6.         OrderWeight(&l, hnew);  
  7.     }  
这里n为总节点数,w[ ]数组里存放了各节点的权重。依次创建各节点,并给结构体成员赋值。

其中OrderWeight(&l, hnew)的作用就是挂上所创建的节点。

最后该函数的返回值

h = (HfNode*)malloc(sizeof(HfNode)); return h;

返回的是个head节点的指针,并该返回值作为 void ReOrderTraverse(HfNode *h, int n) 的参数。 

  1. void ReOrderTraverse(HfNode *ht, int n){  
  2.     if ( ht != NULL ){   
  3.         if ( ht->lchild == NULL && ht->rchild == NULL ){   
  4.  //TODO:XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
  5.         }  
  6.           
  7.         ReOrderTraverse(ht->lchild, n + 1);  
  8.         ReOrderTraverse(ht->rchild, n + 1);  
  9.     }  
可以看到函数的作用就是采用递归的结构遍历整颗二叉树,并完成相应的任务。

至此构造一颗Huffman二叉树的代码的原理就基本明了了。

-------------------学习笔记













原创粉丝点击