机器学习之数学基础——期望、方差、协方差、相关系数、矩、协方差矩阵

来源:互联网 发布:seo的优势 编辑:程序博客网 时间:2024/05/17 05:15

    • 期望
      • 定义
      • 性质
    • 方差
      • 定义
      • 切比雪夫不等式
    • 协方差
      • 定义
      • 性质
      • 协方差的上界
    • 方差和协方差的关系
    • 相关系数
    • 协方差矩阵

期望

定义

  • 离散型

E(X)=ixkpk

  • 连续型

E(X)=xf(x)dx

性质

E[aX+bY]=aE[X]+bE[Y]

方差

定义

D(X)=Var(X)=E{[XE(X)]2}=E(X2)[E(X)]2

切比雪夫不等式

定理 设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对于任意整数ϵ,不等式

P{Xμϵ}σ2ϵ

成立。

切比雪夫(Chebbyshev)不等式也可以写成如下的形式:

P{Xμ<ϵ}1σ2ϵ

切比雪夫不等式给出了在随机变量的分布未知,而只知道E(X)\和D(X)的情况下估计概率P{XE(X)<ϵ}的界限。

协方差

对于二维随机变量(X, Y),除了需要了解X与Y的数学期望和方差意外,还需要掌握描述X与Y之间相互关系的数字特征。

定义

如果两个随机变量X和Y是相互独立的,则

E{[XE(X)][YE(Y)]}=0


E(XY)=E(X)E(Y)

E{[XE(X)][YE(Y)]}称为随机变量X与Y的协方差,记为Cov(X, Y),即

Cov(X,X)=E{[XE(X)][YE(Y)]}=E(XY)E(X)E(Y)

于是
Cov(X,X)=E[X2]E[X]2=D(X)

协方差表达的是两个随机变量总体误差的期望。

性质

  1. 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

  2. 如果X与Y是统计独立的,那么二者之间的协方差就是0,因为两个独立的随机变量满足E[XY]=E[X]E[Y]。但是,反过来并不成立。即如果X与Y的协方差为0,二者并不一定是统计独立的。协方差为0的两个随机变量称为是不相关的。独立一定不相关,不相关不一定独立。

Cov(X,Y)=Cov(Y,X)Cov(aX,bY)=abCov(X,Y), a, bCov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

协方差的上界

Var(X)=ρ21,Var(Y)=ρ22,则 Cov(X,Y)ρ1ρ2

当且仅当XY之间有线性关系时,等号才成立。

方差和协方差的关系

D(X+Y)=D(X)+D(Y)+2Cov(X,Y)D(XY)=D(X)+D(Y)2Cov(X,Y)Cov(X,X)=E[X2]E[X]2=D(X)

相关系数

ρXY=Cov(X,Y)D(X)D(Y)

称为随机变量X与Y的相关系数,也成Pearson相关系数。

定义XY是随机变量,若

E(Xk),k=1,2,...

存在,称它为Xk阶原点矩,简称k阶矩


E{[XE(X)]k},k=2,3,...

存在,称它为Xk阶中心矩


E(XkYl),k,l=1,2,...

存在,称它为XYk+l 阶混合矩


E{[XE(X)]k[YE(Y)]l},k,l=1,2,...

存在,称它为XYk+l 阶混合中心矩

X的数学期望E(X)X的一阶原点矩,方差D(X)X的二阶中心矩,协方差Cov(X,Y)XY的二阶混合中心矩。

协方差矩阵

二维随机变量(X1,X2)有四个二阶中心矩(设它们都存在),分别记为

c11=E{[X1E(X1)]2}c12=E{[X1E(X1)][X2E(X2)]}c21=E{[X2E(X2)][X1E(X1)]}c22=E{[X2E(X2)]2}

将它们写成矩阵的形式

A=(c11c21c12c22)

这个矩阵称为随机变量(X1,X2)协方差矩阵

n维随机变量(X1,X2,...,Xn)的二阶混合中心矩

cij=Cov(Xi,Xj)=E{[XiE(Xi)][XjE(Xj)]},i,j=1,2,...,n

都存在,则称矩阵
C=c11c21...cn1c12c22...cn2..................c1nc2n...cnn

n维随机变量(X1,X2,...,Xn)的协方差矩阵。

协方差矩阵是一个对称矩阵。

阅读全文
1 0
原创粉丝点击