找到100亿个url中重复的url以及搜索词汇的topk问题

来源:互联网 发布:沉默 知乎 编辑:程序博客网 时间:2024/05/08 10:10
1.哈希分流到多台机器2.哈希表统计每个机器中的每个小文件3.最小堆(想一想为什么是最小堆?)
0 0
原创粉丝点击