机器学习笔记之基础数学知识(一)

来源:互联网 发布:万国数据员工工资高吗 编辑:程序博客网 时间:2024/06/11 05:52

协方差

定义:

CovXY=E((XE(X)(YE(Y)))=E(XY)2E(Y)E(X)+E(X)E(Y)=E(XY)E(X)E(Y)

从直观上来看,协方差表示的是两个变量总体误差的期望。
如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
如果X与Y是统计独立的,那么二者之间的协方差就是0,因为两个独立的随机变量满足E[XY]=E[X]E[Y]
但是,反过来并不成立。即如果X与Y的协方差为0,二者并不一定是统计独立的。
协方差Cov(X,Y)的度量单位是X的协方差乘以Y的协方差。而取决于协方差的相关性,是一个衡量线性独立的无量纲的数。
协方差为0的两个随机变量称为是不相关的。

协方差矩阵

对于n个随机向量(x1,x2,,xn)任意两个元素xixj都可以得到一个协方差,从而形成nn的矩阵,协方差矩阵是对称阵,且对称阵的不同特征值对应的特征向量正交。

Cij=E((xiE(xi)(xjE(xj)))

C=c11cn1c12cn2c1ncnn

对于随机变量X,Xk阶原点矩为E(xk),1阶的原点矩是期望。Xk阶中心矩为E((XE(X))k),2阶中心矩是方差。

随机变量的矩和样本的矩有什么关系呢?

1.样本是独立同分布
2.可以通过样本x1,x2,,xn方便的计算样本的k阶矩
3.如果我们假设样本的k阶矩等于总体的k阶矩,可估计出总体的参数

矩估计

设总体的期望为μ,方差为σ2μσ )未知,则有原点矩的表达式

E(X)E(X2)=μ=Var(X)+(E(X))2=σ2+μ2

根据该总体的一组样本求的原点矩:
A1A2=1ni=1nxi=1ni=1nxi2

跟据各自阶的中心矩相等令A1=E(X),A2=E(X2)得:

μ^σ^2=x¯=1ni=1nxi=1ni=1n(xix¯)2

于是得到了总体的μ^σ^2的估计值。

原创粉丝点击