如何用随机函数rand5来构造随机函数rand7 一道经典的算法题

来源:互联网 发布:自制松露巧克力 知乎 编辑:程序博客网 时间:2024/05/23 22:07

试一下以对话的方式写博~如果看不到人物头像,请刷新页面获取最新的CSS。如果有建议或意见,欢迎到我的微博上跟帖~ 这里是腾讯微博,这里是新浪微博。

常规方法

  • 今天公司有一个面试题是这样的:假如有一个函数rand5能等概率生成1 - 5 之间的整数,如何利用rand5来实现rand7?rand7函数的要求是能够等概率生成1 - 7之间的整数。说实话我自己也不是很清楚。
  • 这个问题很经典的。carreercup那本书上有个常见的解法,我记得算法大概是这样的,用PHP写写吧:
01echo 'rand7 = '.rand7();
02 
03function rand7()
04{
05    while (true)
06    {
07        //得出[0,24]的平均分布
08        $i = 5 * (rand5() - 1) + (rand5() - 1);
09        //只取前21个, 前21个也是平均分布,然后mod 7
10        if$i < 21 )
11        {
12            return $i % 7 + 1;
13        }
14    }
15}
  • 这么写是什么意思呢?
  • 两次使用rand5(),可以生成1-25的所有数。5 * (rand5() - 1) 可以生成 0 - 20,而后面的则可以生成0 - 4。用数学表达的话就是 [0, 24]。
  • [0, 24] 范围内生成的随机数$i如果大于21,就用 while (true) 重新生成。当$i < 21的时候,就可以用模运算了。
  • 明白了。当 $i < 21的时候,模 7 的结果是 0-6,加1就可以修正为 1-7,这样就可以通过rand5来实现rand7了。

算法的一些释疑

  • 话说得出[0,24]的平均分布的 $i = 5 * (rand5() - 1) + (rand5() - 1); 为什么要这么写呢?为什么不能直接 $i = 6 * (rand5() - 1) ?
  • rand5()产生的是[1,5]的均匀分布,但是有没有发现最后产生的rand7()却是[0,6]的,那么平均分布是如何实现的呢?
  • 5*(rand5()-1) 生成的是 0, 5,10,15,20各20%的概率,rand5()-1 是0,1,2,3,4各20%概率,两者相加,就是0-24各1/25的概率,这样就保证了平均分布的问题了。基本的概率和排列组合问题了。
  • 前21个也是平均分布,那么我取 $i < 14 也可以么?这样也能保证平均分布吗?
  • 应该也可以,但是增加了可能的循环次数。你看到 while (true) 这行代码吗?当while里面的条件不满足,循环就会一直下去。所以从程序上考虑,就是用了21而非14吧。

晚些时候

  • 我Google了下,貌似还有其它思路。先用2个rand5产生rand10(注意,不是相加),然后从rand10产生rand7。
01// Gen 0, 1 equal probability
02int rand01()
03{
04    int i = rand5();
05    while (i > 4) {i = rand5();}
06    return i % 2;
07}
08  
09// Gen 0, 1, 2, 3, 4, 5, 6, 7 equal probability
10int rand07()
11{
12    return rand01() << 2 + rand01() << 1 + rand01();
13}
14  
15// Gen 1, 2, 3, 4, 5, 6, 7 equal probability
16int rand7()
17{
18    int i = rand07();
19    while (i == 0) {i = rand07();}
20    return i;
21}
  • 还有一种方法,可以直接把概率问题转化到矩阵中解决。
01int matrix[5][5];
02  
03memset(matrix, 0, sizeof(matrix));
04  
05// Set matrix with num 1-7, each num has the same count.
06for (int i = 1; i <= 7; ++i)
07{
08    for (int j = 0; j < 3; ++j)
09    {
10        *matrix++ = i;
11    }
12}
13  
14int rand7()
15{
16    int i;
17  
18    do
19    {
20        i = matrix[rand5() - 1][rand5() - 1];
21    while (i == 0);
22  
23    return i;
24}
  • 你还真好学。。

通过这个面试题学到了等概率问题的各种解法,可以从把数从二进制角度看,可以用公式拼接出更大的等概率值域空间,也可以直接把概率问题转化到矩阵中解决。

rand5() 它能够等概率生成 1-5 之间的整数。所谓等概率就是1,2,3,4,5 生产的概率均为 0.2 。现在利用rand5(), 构造一个能够等概率生成 1- 7 的方法。 这里有两个特别重要的点,一是 如果 rand5() + rand5(), 我们能够产生一个均匀分布的 1 - 10 吗? 答案是否定的。比如对于 6来讲(4+2, 2+4, 3+3),它被生成的生成的概率比1 (1+0,0+1)要大。

第二个点就是我们不可能用rand5()直接产生 1- 7 的数,不管你用加减乘除都不行。所以,我们要构造一个更大的范围,使得范围里每一个值被生成的概率是一样的,而且这个范围是7的倍数。

先产生一个均匀分布的 0, 5, 10, 15, 20的数,再产生一个均匀分布的 0, 1, 2, 3, 4 的数。相加以后,会产生一个 0到24的数,而且每个数(除0外)生成的概率是一样的。我们只取 1 - 21 这一段,和7 取余以后+1就能得到完全均匀分布的1-7的随机数了。

转自:http://www.nowamagic.net/librarys/veda/detail/2172