等概率选取未知长度的链表中的元素

来源:互联网 发布:七天网络网页注册 编辑:程序博客网 时间:2024/05/06 06:05

 

有个链表,长度未知,要随机(等概率)选取其中的item

代码如下:
int nmatch = 0;
for ( p=list; p!=NULL; p=p->next ){
    if ( rand() % ++nmatch == 0 ){
        wanted = p;
    }

wanted 即为所求item


命题: 链表中的每个元素的选择概率为1/n,其中n=链表长度
以n为归纳条件
证明如下:
当n=1时,有100%的概率选取第1个item,链表中的每个元素的选择概率为1/1
当n=2时,第一次循环时有100%的概率选取第1个item,第2次循环时有50%的概率选取第2个item(即替换了第1个元素),因此当链表有2个item时,任何一个被选取的概率都是1/2
假设当n=k时,链表中的每个元素的选择概率为1/k
当n=k+1时,将k+1个元素的链表分成两部分(前k个元素组成的链表和第k+1个元素)。由归纳假设,前k次循环可以使链表的前k个元素的每一个被选中的概率为1/k,设前k个元素中的任何一个为i,则选取i的概率为1/k。
最后一次循环的if ( rand() % ++nmatch == 0 ),使得选取第k+1个元素的概率是1/(k+1)。
则在k+1个元素的链表中选取i的概率为1/k-1/k*1/(k+1)=1/(k+1),其中1/k表示前k个元素中选中i的概率,1/k*1/(k+1)表示选中i之后又选了第k+1个元素(即选中的元素i被k+1替换了)。由于i的一般性,则前k个元素的选取概率都为1/(k+1)。从而在有k+1个元素的链表中,每个元素的选取概率都是1/(k+1),得证。

 

原创粉丝点击