程序博客网 > 制造业大数据

算法导论学习笔记（四）初稿

来源：互联网发布：制造业大数据编辑：程序博客网时间：2024/04/30 03:54

5.1 雇用问题

平均运行时间：所有可能输入分布取平均值的运行时间
期望时间：随机算法的运行时间
当概率分布是在算法的输入上时，讨论平均运行时间，当算法本身做出随机选择时，讨论期望运行时间

5.2 指示器随机变量

个人感觉与独立重复试验类似

核心：将问题分解为子问题
应聘者问题的指示器随机变量解法
$E [X] = \sum x = 1 n x P {X = x} = \sum i = 1 n E [x i] = \sum i = 1 n 1 / i = l n n + O (1)$
关于例题
- 帽子核对问题
  对于每个顾客，拿到自己的帽子的概率为1/n，故其数学期望为∑ni=11/n=1
- 逆序对问题
  对于每一组数的组合，都有一半的概率为逆序，故其数学期望为C2n⋅12=n(n−1)/4

5.3 随机算法

含义
让分布固定，而通过特定算法实现随机化。
随机排列数组
- PERMUTE-BY-SROTING
  - 即为每一个数组元素随机分配一个rank值，并以rank重新排列这些元素。
  - 通过条件概率可证明每种分配的可能均为1/n!
  - 通过5.3-4可知，对于每个元素A[i]，排在任一位置的概率均为1/n，并非是证明均匀随机排列的充分条件
- RANDOMIZE-IN-PLACE
  - 即对于每个元素，都与它后面（包含自身）的元素相交换。
  - 证明
    - 初始化：初始化赋值i=2（涉及讨论i=1的空数组，故先显式交换一次），即对于每个1排列，长度为1的子数组包含这种排列的概率为 (n−1)!/n!=1/n，第一次循环迭代前循环不变式成立。
    - 保持：假设i次迭代前每种(i-1)排列出现概率为(n−i+1)!/n!，则第i次迭代后，概率为1n−i+1⋅(n−i+1)!n!
    - 终止：终止时，i=n+1，子数组任一排列概率为1/n!

5.4 特征序列

问题：抛一枚标准硬币n次，求最长连续正面的数学期望
思路：类似夹逼准则
证明过程：
- O(lgn)
  - 设连续掷硬币k次，k=2lgn。
  - 起始于某一位置，长度**大于等于**k的序列至多有n-k+1个，故开始于任一位置的概率总和小于等于
    $\sum i = 1 n - k + 1 1 / 2 k \leq \sum i = 1 n - k + 1 1 / n 2 < \sum i = 1 n 1 / n 2 = 1 / n$
  - 由定义知
    $E [L] = \sum j = 0 n j P {L j} = \sum j = 0 k - 1 j P {L j} + \sum j = k n j P {L j}$
    其中j为长度的具体值。
  - 显然，当j较大时P{Lj}较小，当P{Lj}较大时j较小，故
    $E [L] < \sum j = 0 k - 1 k P {L j} + \sum j = k n n P {L j} < k \sum j = 0 k - 1 P {L j} + 1$
    又因为∑k−1j=0P{Lj}<1，原式小于O(k)=O(lgn)
- Ω(lgn)
  - 把n次投掷划分为n/s组，每组掷s次，s取lgn/2。
  - 显然任一一组，结果为同一面（假设为正面）概率为
    $1 / 2 s = 1 / n \sqrt$
  - 故每组都不是同一面概率为
    $(1 - 1 / n \sqrt) n / s - 1 \leq e (n / s - 1) / n \sqrt = O (e - lg n = O (1 / n))$
  - 对j值较小的部分，其值忽略不计，因此
    $\sum j = 0 n j P {L j} \geq \sum j = s n j P {L j} \geq s \sum j = s n P {L j} \geq s (1 - O (n)) = Ω (lg n)$
结论：特征序列长为lgn。
指示器随机变量的近似结果：n−k+12k，且带入k=lgn时值近似符合要求。

5.5 在线雇佣问题

问题：只雇佣一次应聘者，并且每次应聘必须决定是否雇佣这个人。
实现思路：选择一个正整数k，面试并拒绝前k个应聘者，并雇佣后面第一个分数比前k个应聘者中分最高者还高的人，若没有则雇佣最后一个人。问题转化为寻找k的最优值。
过程：
- 令P{Si}表示应聘者为第i时面试成功的概率，Bi表示最佳面试者为第i人的概率，M(j)表示前1~j人中的最高分，Oi表示从k+1到i-1的应聘者都小于M(k)的概率。
- 显然
  $P {S} = \sum i = k + 1 n P {S i}$
  $P {B i} = 1 / n$
  $P {O i} = k / (i - 1)$
  $P {S i} = P {B i} \cdot P {O i}$
- 解得 P{S}=kn(lnn−lnk)
- 求导，得k=n/e

0 0

制造业大数据

制造业大数据

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子病毒感染发烧怎么办人乳瘤病毒阳性怎么办感染hpv病毒怎么办宫颈流血怎么办 tct检查ascus怎么办背上长有怎么办经常长疣子怎么办啊手指上长疣怎么办手上长休子怎么办脸上长有怎么办孕妇口腔溃疡了怎么办孕妇口腔溃疡怎么办孕妇长口腔溃疡怎么办手指干燥粗糙怎么办阴茎根部长刺猴怎么办舌头根部溃疡怎么办脸毛孔粗大怎么办鼻头毛孔粗大怎么办舌头上长痘痘怎么办舌头上长包怎么办舌头起包怎么办系带短怎么办系带撕裂怎么办系带反复撕裂怎么办唇系带断了怎么办筋络不通怎么办身体经络不通怎么办腿上长毛怎么办小孩口腔疱疹怎么办儿童舌下腺囊肿怎么办眉毛稀疏怎么办取发区毛囊炎怎么办婴儿过敏怎么办崔玉涛新生儿消化不好怎么办身上鸡皮疙瘩多怎么办眉毛高低不一样怎么办眉毛缺失怎么办天生颈纹很深怎么办额头发际线很高怎么办发际线太高了怎么办后面发际线太低怎么办