水塘抽样 - Reservoir Sampling

来源:互联网 发布:网络 潘多拉盒 编辑:程序博客网 时间:2024/05/04 14:06

Reservoir Sampling( Reservoir sampling )

给一个Streaming的Data,未知长度,要求在Streaming结束后返回N个Data,且是等概率的

O(L)


假设数组S以0开始:

从S中抽取前k项放入「水塘」中对于每一个S[j]项(j ≥ k):   随机产生一个范围从0到j的整数r   若r<k则把水塘中的第r项换成S[j]项

0 0
原创粉丝点击