正态分布的随机数发生器

来源:互联网 发布:js获取当前点击对象id 编辑:程序博客网 时间:2024/04/30 03:01
  • 高斯与正态分布

Francis Galton

  1809年,高斯(Carl Friedrich Gauss,1777—1855)发表了其数学和天体力学的名著《绕日天体运动的理论》。在此书末尾,他写了一节有关“数据结合”(data combination)的问题,实际涉及的就是这个误差分布的确定问题。

  他的做法与拉普拉斯相同。但在往下进行时,他提出了两个创新的想法。一是他不采取贝叶斯式的推理方式,测量误差是由诸多因素形成,每种因素影响都不大。按中心极限定理,其分布近似于正态分布是势所必然。其实,早在1780年左右,拉普拉斯就推广了狄莫佛的结果,得到了中心极限定理的比较一般的形式。可惜的是,他未能把这一成果用到确定误差分布的问题上来。高斯的第二点创新的想法是:他把问题倒过来,先承认算术平均是应取的估计,然后去找误差密度函数条件下才能成立,这就是正态分布。一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。遵从正态分布的随机变量的概率规律为取μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线。当μ=0,σ2=1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
   正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。
  高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。 

  • 正态分布的随机数发生器

主要参考《Numerical Recipes in C++ 2/e》p.292~p.294 和《Simulation Modeling and Analysis 3/e》p.465~p.466。

Box 和 Muller 在 1958 年给出了由均匀分布的随机变量生成正态分布的随机变量的算法。设 U1, U2 是区间 (0, 1) 上均匀分布的随机变量,且相互独立。令

X1 = sqrt(-2*log(U1)) * cos(2*PI*U2);
X2 = sqrt(-2*log(U1)) * sin(2*PI*U2);


那么 X1, X2 服从 N(0,1) 分布,且相互独立。等于说我们用两个独立的 U(0,1) 随机数得到了两个独立的 N(0,1)随机数。

Marsaglia 和 Bray 在 1964 年提出了一种改进算法,避免使用三角函数。以下的实现代码用的就是这种改进算法。



// 
// Gaussian Random Number Generator class
// ref. ``Numerical Recipes in C++ 2/e'', p.293 ~ p.294
//
  public class GaussianRNG
  {
    int iset;
    double gset;
    Random r1, r2;
   
    public GaussianRNG()
    {
      r1 = new Random(unchecked((int)DateTime.Now.Ticks));
      r2 = new Random(~unchecked((int)DateTime.Now.Ticks));
      iset = 0;
    }
   
    public double Next()
    {
      double fac, rsq, v1, v2;   
      if (iset == 0) {
        do {
          v1 = 2.0 * r1.NextDouble() - 1.0;
          v2 = 2.0 * r2.NextDouble() - 1.0;
          rsq = v1*v1 + v2*v2;
        } while (rsq >= 1.0 || rsq == 0.0);
       
        fac = Math.Sqrt(-2.0*Math.Log(rsq)/rsq);
        gset = v1*fac;
        iset = 1;
        return v2*fac;
      } else {
        iset = 0;
        return gset;
      }
    }
  }

原创粉丝点击