Kernel density estimation 核密度估计

来源：互联网发布：软件测试班编辑：程序博客网时间：2024/05/16 17:10

kernel density estimation是在概率论中用来估计未知的密度函数，属于非参数检验方法之一，由Rosenblatt (1955)和Emanuel Parzen(1962)提出，又名Parzen窗（Parzen window）。Ruppert和Cline基于数据集密度函数聚类算法提出修订的核密度估计方法。

可以参考 http://www.mvstat.net/tduong/research/seminars/seminar-2001-05/

https://chemicalstatistician.wordpress.com/2013/06/09/exploratory-data-analysis-kernel-density-estimation-in-r-on-ozone-pollution-data-in-new-york-and-ozonopolis/

核密度估计，主要是根据密度函数来计算集合中个项的分布情况。其中密度函数是以各个数值为中心进行计算。

下面从一维数据来介绍核密度估计。

如下图1左图所示，有12个数据点，分布在横轴坐标上，现在以箱子（直方图中的小正方块）来对数据点分布情况进行描述，每个箱子的宽度为0.5 （对应 binwidth =0.5），图中纵轴表示在横轴区域中出现点的数目。

当以同样的宽度，将最右边的箱子往右移动0.25，那么箱子的堆积方式变为图1右图所示。