概率、随机数、随机数生成函数
来源:互联网 发布:周易古经今注 知乎 编辑:程序博客网 时间:2024/04/28 20:49
相关的面试中涉及的随机数生成、以及概率的有关问题的讨论,请参阅 如何通过投掷一枚硬币产生各种概率。
解决这类题有两大窍门:
0-1区间上的均匀分布,和 if 相结合实现对某一概率的要求;
多次采样,并不限制为1次;
适当地取舍;
首先来看一道笔试题:
实现某一随机数生成函数 f()f(),返回0的概率是60%,返回1的概率是40%(有偏置型硬币)。
假设此时 f()f()已知,根据 f()f()求另一随机数生成函数 g()g(),使返回 0,10,1的概率均为 0.5, 0.5.
多次取样,求joint probability(联合概率)。对本例而言,调用两次 f()f()即可,此时会出现4中结果(构成样本空间),(0, 0), (0, 1), (1, 0), (1, 1),其中出现(0, 1)(0.6*0.4)和(1, 0)(0.4*0.6)的概率是一致的,据此可构造等概率事件。
我们接着看如何符合某一概率分布(离散型)进行采样,而不限于
如下的伯努利分布(最为简单的0-1分布),比如三个离散值 [(1,0.3),(2,0.4),(3,0.3)][(1, 0.3), (2, 0.4), (3, 0.3)]。
此时我们需要重新定义该函数形式:
简单验证:
输出为:
《程序员面试金典第5版》(Cracking the Coding Interview) 也有一道给定一个随机数生成函数生成另一个随机数函数的题目;
给定rand5(),实现一个方法rand7()。也即,给定一个产生0到4(含)随机数方法,编写一个产生0到6(含)随机数的方法。(P105)
解题的关键在于确保产生每一个数的概率相等。我们首先来分析:
rand5(): [0, 1, 2, 3, 4]
2*rand5(): [0, 2, 4, 6, 8]
rand5() + rand5():(rand5()+rand5()不仅与2*rand5()取值范围不同)最终的取值范围在[0, 8],但取每一个值的概率并不相等,比如0=0+0, 4=4+0=0+4=2+2=1+3=3+1,对应于各种情况
5*rand5() + rand5():取值范围在[0, 24],取每一个值的概率达到完美的相等;
稍加变形,给定rand7(),如何实现rand5()呢?
关键还在于确保产生的每一个值的概率相等。
形式上与上面的方法相同:7*rand7()+rand7()
解决这类题有两大窍门:
0-1区间上的均匀分布,和 if 相结合实现对某一概率的要求;
多次采样,并不限制为1次;
适当地取舍;
首先来看一道笔试题:
实现某一随机数生成函数 f()f(),返回0的概率是60%,返回1的概率是40%(有偏置型硬币)。
[code]import random def bias_coin(): p = random.random() return 0 if p < 0.6 else 1
假设此时 f()f()已知,根据 f()f()求另一随机数生成函数 g()g(),使返回 0,10,1的概率均为 0.5, 0.5.
多次取样,求joint probability(联合概率)。对本例而言,调用两次 f()f()即可,此时会出现4中结果(构成样本空间),(0, 0), (0, 1), (1, 0), (1, 1),其中出现(0, 1)(0.6*0.4)和(1, 0)(0.4*0.6)的概率是一致的,据此可构造等概率事件。
[code]def g(): while True: a, b = bias_coin(), bias_coin() if (a, b) == (0, 1): return 1 if (a, b) == (1, 0): return 0
我们接着看如何符合某一概率分布(离散型)进行采样,而不限于
如下的伯努利分布(最为简单的0-1分布),比如三个离散值 [(1,0.3),(2,0.4),(3,0.3)][(1, 0.3), (2, 0.4), (3, 0.3)]。
[code]def bernoulli(p): u = random.random() return 1 if u < p else 0
此时我们需要重新定义该函数形式:
[code]def withProbRandomPick(prob_dist): r = random.random() s = 0 for prob in prob_dist: s += prob[1] # 这一步相加很妙,很妙 if r < s: return prob[0]
简单验证:
[code]prob_dist = [(1, .3), (2, .4), (3, .3)]from collections import defaultdictcnt = defaultdict(int)N = 10**6for i in range(N): cnt[withProbRandomPick(pro_dist)] += 1for n in cnt: print(n, cnt/N)
输出为:
[code]1 0.301592 0.398293 0.30012 # 十分接近
《程序员面试金典第5版》(Cracking the Coding Interview) 也有一道给定一个随机数生成函数生成另一个随机数函数的题目;
给定rand5(),实现一个方法rand7()。也即,给定一个产生0到4(含)随机数方法,编写一个产生0到6(含)随机数的方法。(P105)
解题的关键在于确保产生每一个数的概率相等。我们首先来分析:
rand5(): [0, 1, 2, 3, 4]
2*rand5(): [0, 2, 4, 6, 8]
rand5() + rand5():(rand5()+rand5()不仅与2*rand5()取值范围不同)最终的取值范围在[0, 8],但取每一个值的概率并不相等,比如0=0+0, 4=4+0=0+4=2+2=1+3=3+1,对应于各种情况
5*rand5() + rand5():取值范围在[0, 24],取每一个值的概率达到完美的相等;
[code]# 这里不妨给出rand5()的简单实现def rand5(): p = random.random() return int(p*5)
[code]# 根据rand5(),得rand7()的实现def rand7(): while True: x = 5*rand5()+rand5() if x < 21: return x%7
稍加变形,给定rand7(),如何实现rand5()呢?
关键还在于确保产生的每一个值的概率相等。
形式上与上面的方法相同:7*rand7()+rand7()
[code]# 也姑且给出rand7()的简单实现def rand7(): p = random.random() return int(7*p)
[code]def rand5(): while True: x = 7*rand7()+rand7() while x < 45: return x%5
0 0
- 概率、随机数、随机数生成函数
- 概率、随机数、随机数生成函数(面试题)
- 按概率生成随机数
- 按照概率生成随机数
- 随机数及按照概率生成随机数
- 概率条件下随机数的生成
- python按概率生成随机数
- 根据概率密度函数生成随机数的代码
- 随机数函数取样与概率
- 一个随机数生成函数
- 一个随机数生成函数
- excel 函数 生成 随机数
- oracle生成随机数函数
- OpenCV函数生成随机数
- rand函数生成随机数
- matlab生成随机数函数
- PHP函数生成随机数
- C随机数生成函数
- 关于分布式系统的数据一致性问题(三)
- C#中字符 '\0' 是a还是空格?
- A5D2应用程序无法启动问题
- <30天自制操作系统>第一天
- js查找数组元素位置
- 概率、随机数、随机数生成函数
- 提高Java 性能的5点 理解+实用
- 3.2 MEID和IMEI
- mysql prepare语句使用
- MurmurHash
- Jenkins build失败后继续后续执行命令
- 收集的27个java开发常用工具类.基本满足开发需求
- 3.3 IMSI ICCID和PLMN
- 笔记心理学