lecture4,backpropagation and nerual network

来源：互联网发布：依伊芭莎淘宝编辑：程序博客网时间：2024/06/08 07:45

1，computational graphs,一系列简单的计算过程组成的一张图，易于求导(理论指导为链式法则)

a,. feedward

b,backward:前一个输入当作未知数求导，因为前一个输入包含着与未知数w的关系。即dydw=dydf(x).df(x)dx ,f(x)视为前一个输入。
所以

全连神经网络的bp过程：
- 数学方法：

以上图只有一个隐层的神经网络为例：得到y前，输入的softmax函数的变量用t表示。z经过activition function 后的输出用s表示。
未知数为权值矩阵

Wdm[d+1,m],Wmk[m+1,k],

l o s s = - \sum i = 1 k t i l n y i, y i = e t i \sum k a = 1 e t a

所以有

d l o s s d y i = t i y i (1)

d y i d t i = y i (1 - y i) (2), d y j d t i = - y i y j (3)

由(1)(2)(3)式得

d l o s s d t i = d l o s s d y i . d y i d t i + \sum j \neq i d l o s s d y j . d y i d t i = y i - t i

2，对max gate的求导：

z = m a x (x, y) | x = 2, y = 0

此时

z对

x的导为2，对

y的导为0.

3，向量对矩阵或向量求导

A x = y

所以有

y1=a11x1+a12x2+...+a1nxn,...,yn=an1x1+an2x2+...+annxn

观察可知：dyidaij=xj,dykdaij=0(k≠i)，所以(dydA)ij=xj。同理因为dyidxj=aij，所以(dydx)i=∑nk=1aki。

阅读全文

0 0