海量数据处理 ——hash算法
来源:互联网 发布:答题软件 编辑:程序博客网 时间:2024/05/18 10:58
http://blog.csdn.net/jiaomeng/article/details/1511269
http://blog.csdn.net/jiaomeng/article/details/1508555
时间换空间
Dictionary是一种抽象数据类型,用来存储可以用键值(key)索引的数据项,基本的操作包括插入、查找和删除。它是一个相对比较广义的概念,并没有规定具体的实现,比如在底层用什么数据结构存储数据项。因此,只要存储的每一个数据项是一对(key, value),并可以用key索引到这一项,就可以将这样的数据类型称为Dictionary。
Direct-address Tables和Hash Tables都是Dictionary的具体实现方式。Direct-address Tables其实就是普通的数组,数组的第k项只被用来存储键值为k的数据项。显然,要应用这种数据结构必须给每一个可能的键值预留一个数组项,因此它只适用于键值的集合比较小的情况。虽然Direct-address Tables看起来比较浪费内存,但也有它的优点:插入、查找和删除操作的时间复杂度为O(1)。
Hash Tables是Dictionary的一种有效实现,它解决了Direct-address Tables在键值集合比较大的情况下不适用的问题。假设U表示所有可能的键值的集合,K表示实际要存储的键值的集合。在|U|远远大于|K|的时候,Hash Tables只分配和|K|大小成比例的数据表项,然后通过哈希函数将K映射到各个表项中。Hash Tables通过将取值范围很大的键值映射到较小的集合中,极大地节省了存储空间,但同时引入了碰撞(Collision)的因素,即几个键值映射到同一表项的情况。由于处理碰撞而增加的复杂度,常常使查找或删除等操作的时间复杂度不再为O(1),在最差的情况下甚至为O(n)(n = |K|)。但在实际中,通过选择合适的哈希函数,上述操作的时间复杂度常常能控制在接近O(1)。 ---- 如IP地址范围过大,hash到不同的hash表
- 海量数据处理 ——hash算法
- 海量数据处理专题(三)——Hash
- 海量数据处理专题(三)——Hash
- 海量数据处理专题(三)——Hash
- 海量数据处理专题(三)——Hash
- 海量数据处理利器之Hash——在线邮件地址过滤
- 海量数据处理专题(三)——Hash
- 海量数据处理利器之Hash——在线邮件地址过滤
- 海量数据处理利器之Hash——在线邮件地址过滤
- 海量数据处理——分治和hash映射
- 海量数据处理利器之Hash——在线邮件地址过滤
- 海量数据处理——分治和hash映射
- 海量数据处理——分治和hash映射
- 算法学习——海量数据处理
- 海量数据处理算法—Bloom Filter
- 海量数据处理算法—Bit-Map
- 海量数据处理算法—Bit-Map
- 海量数据处理算法—Bloom Filter
- 个人官方博客
- installshield2008 修改安装程序图标
- 悬垂指针(Dangling pointer)和野指针(Wild pointer)
- Delphi实现汉字转ASCII码
- emacs -autocomplete
- 海量数据处理 ——hash算法
- live555学习之RTSP连接建立以及请求消息处理过程
- linux gpio接口
- 如何促进自动化测试和游戏项目的集成?
- linux sed 用法
- [HEVC/H265] 另一个开源项目openHEVC
- Java中的HashMap和ConcurrentHashMap的并发性能测试
- [完美解决Dede关键字交叉(重叠)替换问题]dede5.6 关键词自动添加链接
- 智能指针学习