数据结构 第四章 哈夫曼编码与ASCII编码的比较(设想)
来源:互联网 发布:网络it培训 编辑:程序博客网 时间:2024/06/05 10:27
一、随机选择10万字母左右的文章,文章来自新闻、小说、字幕……代表日常用到的英语。
二、将这些文章统一保存到txt文本文档内。
三、编程对文本进行预处理,去掉换行符、空格和其他标点符号,将全部大写转换为小写。
四、编程统计实际总字母数,以及26个小写字母的频数。
五、用统计得到的数据制成字频表。
六、使用哈夫曼树对字母进行哈夫曼编码。以字频为权值。
七、从处理后的文本中随机选一千字,用哈夫曼编码回代字母。
八、计算回代后的空间总长。
九、沿用ASCII码的编码思想,对a~z的编码进行缩减,用0(0 0000)~25(1 1001)的二进制数分别作为它们的编码。
十、用这些编码重复第七步和第八步。
比较两种编码占用的空间大小,得出结论。
临时的想法,应该会有纰漏和不妥。先做记录,有空再实现。
0 0
- 数据结构 第四章 哈夫曼编码与ASCII编码的比较(设想)
- ASCII编码与Unicode编码
- ASCII编码与Unicode编码
- ASCII编码与Unicode编码
- AscII与Unicode编码
- ASCII编码与UTF-8的关系
- 字符编码ASCII、Unicode、UTF-8的比较
- ebcdic编码与ascII编码互转
- 10 ASCII编码与Unicode编码
- ASCII表与字符编码
- 探究Unicode与ASCII编码
- ASCII表与字符编码
- ASCII表与字符编码
- XSS的原理分析与解剖:第四章(编码与绕过)
- ASCII 编码
- ASCII 编码
- ASCII 编码
- ASCII 编码
- 高级搜索语法
- JAVA设计模式之工厂模式(简单工厂模式+工厂方法模式+抽象工厂模式)
- php 获取并解析哈工大ltp-cloud返回的json数据
- Hibernate二级缓存详解
- JAVA设计模式之工厂模式(简单工厂模式+工厂方法模式+抽象工厂模式)
- 数据结构 第四章 哈夫曼编码与ASCII编码的比较(设想)
- Ubuntu-卸载已经安装的软件
- BestCoder #20
- 国行iPhone 6添加被阉割的facetimeaudio功能
- strcmp函数
- J2ME访问远端的Web Service
- 使用Qt Creator编译cpp遇到错误cc1plus.exe: out of memory allocating
- 递归找零问题
- 字母排序