哈夫曼树编码及其图形化的实现
来源:互联网 发布:软件招标网 编辑:程序博客网 时间:2024/04/30 16:44
一、设计要求
1.从文件读入26个英文字母及其权值,建立哈夫曼树并将它存于文件中.将哈夫曼树以直观的方式显示在图形化界面上;
2.利用已经建好的哈夫曼树,对文件中的正文进行编码,然后将结果存入文件中,并求出最短平均编码,哈弗曼最短平均编码,冗余度以及程序运行时间。
二、数据结构
ch: 字符
weight:权重
lchild: 左孩子
rchild: 右孩子
parent: 双亲
p: 绘图坐标
idx,idy:绘图标志
三、代码
/*描述:实现哈夫曼树的图形化以及根据哈夫曼树对数据进行编码*/#include<stdio.h>#include<math.h>#include<graphics.h> //图形化界面用到#include<conio.h>#include<stdlib.h>#include<time.h>#define n 26 //叶子数目#define maxval 10000.0#define maxsize 20 //哈夫曼编码的最大位数typedef struct //坐标数据结构{double x; double y;}Point;typedef struct //节点数据结构{ char ch; float weight; int lchild,rchild,parent; double idx,idy; Point p;}huffmantree;typedef struct{ char bits[n]; //位串 int start; //编码在位串中的起始位置 char ch; //字符}codetype;void huffman(huffmantree tree[]);//建立哈夫曼树void huffmancode(codetype code[],huffmantree tree[]);//根据哈夫曼树求出哈夫曼编码void HuffmanDrawing(huffmantree tree[],codetype code[]);//绘制哈夫曼树void main(){ clock_t start;//程序开始运行时间 clock_t end;//程序结束运行时间 int t; FILE *fp; start=clock();//取得程序开始运行时的系统时间 printf("总共有%d个字符\n",n); huffmantree tree[2*n-1]; codetype code[n]; huffman(tree);//建立哈夫曼树 huffmancode(code,tree);//根据哈夫曼树求出哈夫曼编码 printf("哈夫曼树已绘制,请按任意键查看!"); getchar(); HuffmanDrawing(tree,code);//绘制哈夫曼树 end=clock();//取得程序结束运行时的系统时间 t=(end-start)/CLOCKS_PER_SEC;//计算程序运行总时间 if((fp=fopen("output.txt","ab"))==NULL) //向文本文档追加数据 {printf("can not open the file\n"); exit(0); } fprintf(fp,"程序运行总时间:%d秒\n",t); fclose(fp); printf("程序运行时间已写入文本!\n",t);} void huffman(huffmantree tree[])//建立哈夫曼树{ int i,j,p1,p2;//p1,p2分别记住每次合并时权值最小和次小的两个根结点的下标 float small1,small2,f,sum=0; char c; FILE *fp; for(i=0;i<2*n-1;i++) //初始化 { tree[i].parent=-1; tree[i].lchild=-1; tree[i].rchild=-1; tree[i].weight=0.0; } if((fp=fopen("input.txt","r"))==NULL)//从文件读取字符、权值 {printf("can not open the file\n"); exit(0); } for(i=0;i<n;i++) //读入前n个结点的字符及权值 { fscanf(fp,"%c %f\n",&c,&f); tree[i].ch=c; tree[i].weight=f; sum=sum+tree[i].weight;//权值累计 } fclose(fp); if((int)sum==1)printf("文本数据正确,已从中读出!\n"); else printf("数据有误!概率和不为1!\n"); for(i=n;i<2*n-1;i++) //进行n-1次合并,产生n-1个新结点 { p1=0;p2=0; small1=maxval;small2=maxval; //maxval是float类型的最大值 for(j=0;j<i;j++) //选出两个权值最小的根结点 if(tree[j].parent==-1) if(tree[j].weight<small1) { small2=small1; //改变最小权、次小权及对应的位置 small1=tree[j].weight; p2=p1; p1=j; } else if(tree[j].weight<small2) { small2=tree[j].weight; //改变次小权及位置 p2=j; } tree[p1].parent=i; tree[p2].parent=i; tree[i].lchild=p1; //最小权根结点是新结点的左孩子 tree[i].rchild=p2; //次小权根结点是新结点的右孩子 tree[i].weight=tree[p1].weight+tree[p2].weight; }}void huffmancode(codetype code[],huffmantree tree[])//根据哈夫曼树求出哈夫曼编码{ int i,c,p; codetype cd; //缓冲变量 float sum=0,summ=0,x;//冗余度 FILE *fp; for(i=0;i<n;i++) { cd.start=n; cd.ch=tree[i].ch; c=i; //从叶结点出发向上回溯 p=tree[i].parent; //tree[p]是tree[i]的双亲 while(p!=-1) { cd.start--; if(tree[p].lchild==c) cd.bits[cd.start]='0'; //tree[i]是左子树,生成代码'0' else cd.bits[cd.start]='1'; //tree[i]是右子树,生成代码'1' c=p; p=tree[p].parent; } code[i]=cd; //第i+1个字符的编码存入code[i] sum=sum+(n-cd.start)*tree[i].weight; //计算平均码长 summ=summ+tree[i].weight*log10(tree[i].weight)/log10(2);//计算最短平均码长 } x=(sum+summ)/sum;//计算冗余度 if((fp=fopen("output.txt","w"))==NULL) //输出哈夫曼编码到文件 {printf("can not open the file\n"); exit(0); } fprintf(fp,"每个字符的哈夫曼编码:\n"); for(i=0;i<n;i++) { fprintf(fp,"%c: ",code[i].ch); for(int j=code[i].start;j<n;j++) fprintf(fp,"%c ",code[i].bits[j]); fprintf(fp,"\n"); } fprintf(fp,"最短平均码长:%f\n",0-summ);//输出平均码长、最短码长以及冗余度到文件 fprintf(fp,"哈夫曼编码平均码长:%f\n",sum); fprintf(fp,"冗余度为:%f\n",x); fclose(fp); printf("编码完成!\n编码,平均码长,冗余度已写入文本!\n");}void HuffmanDrawing(huffmantree tree[],codetype code[])//绘制哈夫曼树{char a[n][20],c[n][20];tree[2*n-2].idx=1;tree[2*n-2].idy=1;for(int i=2*n-2;i>=n;i--)//将哈夫曼树与完全二叉树对应起来{tree[tree[i].lchild].idx=2*tree[i].idx;tree[tree[i].rchild].idx=2*tree[i].idx+1;tree[tree[i].lchild].idy=2*tree[i].idy;tree[tree[i].rchild].idy=2*tree[i].idy+1;}for(i=2*n-2;i>=0;i--)//为idx域赋值tree[i].idx=tree[i].idx/ pow(2,(int)(log10(tree[i].idx)/log10(2)));for( i=0;i<=n-1;i++)//求出每个i叶子节点的idx排序{for(int j=0,k=1;j<n;j++){if(tree[j].idx<tree[i].idx)k++;}tree[i].p.x=300+k*30;//根据叶子节点的idx排序求出叶子节点的x坐标}for(i=n;i<2*n-1;i++)//根据叶子节点求出双亲的x坐标{tree[i].p.x=(tree[tree[i].lchild].p.x+ tree[tree[i].rchild].p.x)/2;}for( i=0;i<2*n-1;i++) tree[i].p.y=40*int(log10(tree[i].idy)/log10(2));//根据节点的层数求出节点的y坐标for(i=0;i<n;i++){ //对文本编码的图形化转换for(int j=code[i].start,k=0;j<n;j++,k++){c[i][k]=code[i].bits[j];} c[i][k]='\0';}for(i=0;i<n;i++){ //对文本权值的图形化转换sprintf(a[i], "%g", tree[i].weight);}initgraph(1000,600);//初始化绘图屏幕 setcolor(WHITE); setbkcolor(WHITE);setfillstyle(WHITE); cleardevice(); setcolor(BLACK); outtextxy(10,0,"字母 概率 编码");for(i=0;i<n;i++) //输出每个字符及其对应的概率、编码{ outtextxy(20,20*(i+1),tree[i].ch); outtextxy(50,20*(i+1),a[i]); outtextxy(110,20*(i+1),c[i]);}for(i=0;i<2*n-1;i++) //绘制节点,以小圆代替{circle((int)tree[i].p.x-100,100+(int)tree[i].p.y,2);if(tree[i].lchild==-1) outtextxy((int)tree[i].p.x-100,105+(int)tree[i].p.y,tree[i].ch);if(tree[i].lchild!=-1) //绘制节点的左右子树{outtextxy((int)(tree[i].p.x+tree[tree[i].lchild].p.x)/2-100,//左子树标0 (int)(tree[i].p.y+tree[tree[i].lchild].p.y)/2+100,"0");outtextxy((int)(tree[i].p.x+tree[tree[i].rchild].p.x)/2-100,//右子树标1 (int)(tree[i].p.y+tree[tree[i].rchild].p.y)/2+100,"1");line((int)tree[i].p.x-100,(int)tree[i].p.y+100,//绘制节点与左子树的连线 (int)tree[tree[i].lchild].p.x-100, (int)tree[tree[i].lchild].p.y+100);line((int)tree[i].p.x-100,(int)tree[i].p.y+100,//绘制节点与右子树的连线 (int)tree[tree[i].rchild].p.x-100, (int)tree[tree[i].rchild].p.y+100);}}outtextxy(200,50,"按回车返回");getch();closegraph(); //关闭绘图屏幕}
四、输入输出
输入:
输出:
参考:
[1] 严蔚敏,吴伟民.数据结构(C语言版)[M].北京:清华大学出版社,1997.
[2] 孙学琛,李新洁.哈夫曼树的图形化算法设计[J].山东理工大学学报,2008.
注意:
需要安装Easyx图形库,完整工程http://download.csdn.net/detail/csdn86868686888/9736773
0 0
- 哈夫曼树编码及其图形化的实现
- Huffman树及其编码实现
- 哈夫曼编码算法及其实现
- vi文本编码及其与中文转换的实现方法
- 优先队列的实现及其在哈夫曼编码中的应用
- 哈夫曼树及其编码
- 哈夫曼树的编码实现
- 【数据结构】图形的多种表示方法及其java实现之相邻矩阵法
- 【数据结构】图形的多种表示方法及其java实现之相邻表法
- UltraEdit的问题及其编码
- 哈弗曼树的建立及其编码
- 图形类的实现
- 实现能动的图形
- 实现能动的图形
- 实现能动的图形
- 图形钟表的实现
- 哈夫曼树及其应用-哈夫曼编码
- 图形的信息编码与表征
- mysqlAPI实例
- nginx配置
- 12 个好用且不花钱的网络监控工具
- (?)数据结构实验之链表七:单链表中重复元素的删除
- 17 - 03 - 28 图解HTTP(32)
- 哈夫曼树编码及其图形化的实现
- 谈谈我理解的测试的核心价值
- mininet安装
- 矩阵第三章总结笔记
- PageRank算法概述及Map-Reduce实现
- HD2084
- migrator
- 在网页中嵌入多媒体内容
- CTR预估