机器学习中的数学知识（-）梯度下降数学理论

来源：互联网发布：数据库的逻辑结构设计编辑：程序博客网时间：2024/05/17 05:17

机器学习中的数学知识

微积分：

f' (a) = l i m x \to 0 f ( a + h ) - f ( a ) h

常见的函数的导数：

(xa)′=axa−1
(ex)′=ex
(ax)′=ln(a)ax
(ln(x))′=1x
dsin(x)dx=cos(x)
dcos(x)dx=sin(x)

导数法则

(αf+βg)=αf′+βg′
(fg)′=f′g+fg′
(fg)′=f′g−fg′g2
如果 f(x)=h(g(x)) 那么 f(x)′=h′(g(x))∗g′(x)

Hessian矩阵
这里写图片描述

泰勒级数与极值

f (x + σ) \approx f (x) + f' (x) σ + 1 2 f " σ 2

从公式中可以看出在点x的函数值如果是极小值点，那么σ表示在x点左右两侧摆动，要使得公式左边大于等式右边（σ>0或者σ<0），则必须满足f′(x)=0
结论：如果满足f′(x)=0的点称为极值点（平稳点），进一步判断：
f"(x)>0, (x,f(x))为极小值点；
f"(x)<0, (x,f(x))为极大值点；
如果f"(x)=0, 则称为拐点
对于矩阵判断其矩阵的正定性。（正定表示其全部特征值大于0）

注意：为什么要用梯度下降，而不是直接令f′(x)=0?
因为实际中函数求导即使求出来，但是要解方程f′(x)=0非常困难。

梯度下降

0 0