bias 和 variance 的推导

来源:互联网 发布:php源码大全 编辑:程序博客网 时间:2024/05/29 04:30

参考 博客ooon

假设 XYY=X+εε是噪声,εN(0,δ2ε)
f(X)f^(X)

Err(x0)=E[(y0f^(x0))2]=E[y202y0f^(x0)+f^2(x0)]=E[y20]2E[y0f^(x0)]+E[f^2(x0)]=E[y20]E2(y0)+E2(y0)2E[y0f^(x0)]+E[f^2(x0)]E2(f^(x0))+E2(f^(x0))

 E[y0]=E[f(x0+ε)]=E(f(x0))Var[y0]=E[(y0E[y0])2]=E[(y0+εy0)2]=E[ε2]Var[X]=E[X2]E2[X]

 Err(x0)=[E[y0]E[f^(x0)]]2+E[f^2(x0)]E2(f^(x0))+Var[ε]=[E[y0]E[f^(x0)]]2+Var[f^(x0)]+Var[ε]=Bias2(f^(x0))+Var[f^(x0)]+δ2ε

对于k近邻,其预测误差为:

Err(x0)=E[(Yf^(x0))|X=x0]=δ2ε+[f(x0)1ki=1Kf(xi)]2+δ2ϵk

随着 k 增大,var 会减小,而bias 会增大。

0 0
原创粉丝点击