词典压缩
来源:互联网 发布:c语言进阶书籍pdf 编辑:程序博客网 时间:2024/04/27 19:53
1. 压缩目的: 将整个词典放在内存,避免多次访问硬盘
2. 假设压缩前词典采用定长数组格式,每个数组的类型如下:
struct
{
char term[k];
int freq;
pointer posting;
}
假设指针长度为4, 则一个term耗费的内存为k + 4 + 4, 这里显然的浪费是在k,因为必须要指定一个定长的k。
因此一种压缩思路就是,将所有的term组装起来放在一个数组里,然后通过指针来索引,结构如下:
然后采用二分查找方式进行查找
在激进一点,可以在每个词开头前存入长度,同时几个term共用一个指针,但这样带来的问题就是查询效率的降低
- 词典压缩
- 前缀压缩词典
- 词典 压缩作业
- 词典压缩器压缩与解压
- 信源编码:压缩词典编码的实现
- 词典
- 词典
- 词典
- 词典
- 词典
- 词典
- 词典
- 词典
- 词典
- 词典
- 词典
- 词典
- 词典
- 利用Oracle Spatial求几何对象的长度和面积
- 作业:电子商务安全--加密标准之专业术语解释
- 随机数的应用算法一——简述
- 常用JavaScript大全
- Oracle Spatial 初探
- 词典压缩
- POS系统开发工程师
- RPC远程过程调用编程练习
- 当今社会很感人的事
- 利用Oracle Spatial实现位置服务
- Ansistring使用方法大全
- 混用AnsiString和c_str()的安全问题
- C语言学习笔记系列(5)结束函数
- 倒排表交集的计算