蓄水池算法(Reservoir Sampling)
来源:互联网 发布:涿州网络兼职招聘网 编辑:程序博客网 时间:2024/06/05 16:27
问题描述,从N个元素中随机抽取k个元素,使得每个元素被抽取的概率相同,并且事先不知道N的值。
解法:
证明每次抽取元素都是等概率的:
由算法可以看出k+1到N每个元素被选择的概率是k/i,当第i+1个元素到来是,第i+1个元素被选中的概率为k/i+1,那么如果这时,前i个元素被选中保留在k个抽样中的概率也为k/i+1的话,那么说明我们的算法没问题,每个元素的概率被抽取出来的概率是相等的。
在网上找到了一个证明,使用归纳法证明的:
对这个问题可以用归纳法来证明:k < i <=N
1.当i=k+1的时候,蓄水池的容量为k,第k+1个元素被选择的概率明显为k/(k+1), 此时前k个元素出现在蓄水池的概率为 k/(k+1), 很明显结论成立。
2.假设当 j=i 的时候结论成立,此时以 k/i 的概率来选择第i个元素,前i-1个元素出现在蓄水池的概率都为k/i。
证明当j=i+1的情况:
即需要证明当以 k/i+1 的概率来选择第i+1个元素的时候,此时任一前i个元素出现在蓄水池的概率都为k/(i+1).
前i个元素出现在蓄水池的概率有2部分组成, 1)在第i+1次选择前得出现在蓄水池中,2)得保证第i+1次选择的时候不被替换掉
1).由2知道在第i+1次选择前,任一前i个元素出现在蓄水池的概率都为k/i
2).考虑被替换的概率:
首先要被替换得第 i+1 个元素被选中(不然不用替换了)概率为 k/i+1,其次是因为随机替换的池子中k个元素中任意一个,所以不幸被替换的概率是 1/k,故
前i个元素(池中元素)中任一被替换的概率 = k/(i+1) * 1/k = 1/i+1
则(池中元素中)没有被替换的概率为: 1 – 1/(i+1) = i/i+1
综合1) 2),通过乘法规则
得到前i个元素出现在蓄水池的概率为 k/i * i/(i+1) = k/i+1
故证明成立
manjushri.sinaapp.com/?p=98&utm_source=rss&utm_medium=rss&utm_campaign=%25e8%2593%2584%25e6%25b0%25b4%25e6%25b1%25a0%25e7%25ae%2597%25e6%25b3%2595%25ef%25bc%2588reservoir-sampling%25ef%25bc%2589
- 蓄水池算法(Reservoir Sampling)
- 蓄水池算法(Reservoir Sampling)
- 蓄水池采样算法(Reservoir Sampling)
- 蓄水池抽样(Reservoir Sampling)
- 蓄水池抽样(reservoir sampling)
- 随机抽样——蓄水池抽样算法(Reservoir Sampling)
- Reservoir Sampling 蓄水池抽样算法,经典抽样
- 蓄水池抽样算法 (Reservoir Sampling Algorithm)
- 蓄水池抽样算法 (Reservoir Sampling Algorithm)
- 有关蓄水池抽样(Reservoir Sampling)
- Reservoir Sampling - 蓄水池抽样
- Reservoir Sampling 蓄水池抽样
- Reservoir Sampling - 蓄水池抽样
- Reservoir Sampling - 蓄水池抽样
- Reservoir Sampling - 蓄水池抽样
- Reservoir Sampling - 蓄水池抽样
- Reservoir Sampling - 蓄水池抽样
- Reservoir Sampling 蓄水池抽样
- JavaScript let的理解
- x264的一些参数设置对编码效率的影响
- 如何优雅地使用Sublime Text
- js/jquery判断浏览器的方法大全
- 用python书写自己的第一个小
- 蓄水池算法(Reservoir Sampling)
- 设计模式:装饰模式
- 【java基础】01.java基础注意点
- 第四条:确定对象被使用前已经先被初始化
- 基于 Agent 的模型入门:Python 实现隔离仿真
- 对各路大神的FPGA串口程序总结
- 一些算法题
- 获取系统中软件的信息
- 1037. 在霍格沃茨找零钱(20)