概率、随机数、随机数生成函数

来源：互联网发布：周易古经今注知乎编辑：程序博客网时间：2024/04/28 20:49

相关的面试中涉及的随机数生成、以及概率的有关问题的讨论，请参阅如何通过投掷一枚硬币产生各种概率。

解决这类题有两大窍门：

0-1区间上的均匀分布，和 if 相结合实现对某一概率的要求；

多次采样，并不限制为1次；

适当地取舍；

首先来看一道笔试题：

实现某一随机数生成函数 f()f()，返回0的概率是60%，返回1的概率是40%（有偏置型硬币）。

[code]import random def bias_coin():    p = random.random()    return 0 if p < 0.6 else 1

假设此时 f()f()已知，根据 f()f()求另一随机数生成函数 g()g()，使返回 0,10,1的概率均为 0.5, 0.5.

多次取样，求joint probability（联合概率）。对本例而言，调用两次 f()f()即可，此时会出现4中结果（构成样本空间），(0, 0), (0, 1), (1, 0), (1, 1)，其中出现(0, 1)（0.6*0.4）和(1, 0)（0.4*0.6）的概率是一致的，据此可构造等概率事件。

[code]def g():    while True:        a, b = bias_coin(), bias_coin()        if (a, b) == (0, 1):            return 1        if (a, b) == (1, 0):            return 0

我们接着看如何符合某一概率分布（离散型）进行采样，而不限于

如下的伯努利分布（最为简单的0-1分布），比如三个离散值 [(1,0.3),(2,0.4),(3,0.3)][(1, 0.3), (2, 0.4), (3, 0.3)]。

[code]def bernoulli(p):    u = random.random()    return 1 if u < p else 0

此时我们需要重新定义该函数形式：

[code]def withProbRandomPick(prob_dist):    r = random.random()    s = 0    for prob in prob_dist:        s += prob[1]                                # 这一步相加很妙，很妙        if r < s:            return prob[0]

简单验证：

[code]prob_dist = [(1, .3), (2, .4), (3, .3)]from collections import defaultdictcnt = defaultdict(int)N = 10**6for i in range(N):    cnt[withProbRandomPick(pro_dist)] += 1for n in cnt:    print(n, cnt/N)

输出为：

[code]1 0.301592 0.398293 0.30012                    # 十分接近

《程序员面试金典第5版》(Cracking the Coding Interview) 也有一道给定一个随机数生成函数生成另一个随机数函数的题目；

给定rand5()，实现一个方法rand7()。也即，给定一个产生0到4（含）随机数方法，编写一个产生0到6（含）随机数的方法。（P105）

解题的关键在于确保产生每一个数的概率相等。我们首先来分析：

rand5()： [0, 1, 2, 3, 4]

2*rand5()： [0, 2, 4, 6, 8]

rand5() + rand5()：（rand5()+rand5()不仅与2*rand5()取值范围不同）最终的取值范围在[0, 8]，但取每一个值的概率并不相等，比如0=0+0, 4=4+0=0+4=2+2=1+3=3+1，对应于各种情况

5*rand5() + rand5()：取值范围在[0, 24]，取每一个值的概率达到完美的相等；

[code]# 这里不妨给出rand5()的简单实现def rand5():    p = random.random()    return int(p*5)

[code]# 根据rand5()，得rand7()的实现def rand7():    while True:        x = 5*rand5()+rand5()        if x < 21:            return x%7

稍加变形，给定rand7()，如何实现rand5()呢？

关键还在于确保产生的每一个值的概率相等。

形式上与上面的方法相同：7*rand7()+rand7()

[code]# 也姑且给出rand7()的简单实现def rand7():    p = random.random()    return int(7*p)

[code]def rand5():    while True:        x = 7*rand7()+rand7()        while x < 45:            return x%5

0 0