【学习笔记】【Coursera】【MachineLearning】Neural Networks

来源：互联网发布：全国dna数据库比对编辑：程序博客网时间：2024/05/21 15:49

课程地址：https://www.coursera.org/learn/machine-learning/home/week/4

Representation

deal with non-linear classification/hypotheses with hundreds of thousands of features
belongs to classification

z(2)1=Θ(1)10x0+Θ(1)11x1+Θ(1)12x2+Θ(1)13x3; a(2)1=g(z(2)1)
z(2)=Θ(1)x; a(2)=g(z(2)) => a(2)=(a(2)1a(2)2a(2)3)
Add a(2)0=1
z(3)=Θ(2)a(2); a(3)=g(z(3))

J (Θ) = - 1 m [\sum i = 1 m \sum k = 1 K y (i) k l o g (h Θ (x (i))) k + (1 - y (i) k) l o g (1 - (h Θ (x (i))) k)] + λ 2 m \sum l = 1 L - 1 \sum i = 1 s l \sum j = 1 s (l + 1) (Θ (l) j i) 2

分别取输出向量（output）与目标向量（target）的一个对应元素（(hΘ(x(i)))k和y(i)k）代入式中求值
$C = y (i) k l o g (h Θ (x (i))) k + (1 - y (i) k) l o g (1 - (h Θ (x (i))) k$
计算所有矩阵中的所有元素求得cost
$J (Θ) = - 1 m \sum i = 1 m \sum k = 1 K C$
加上正则化项（regularization term），其值为所有Θ矩阵元素的平方和，再乘以惩罚率λ（Θj0对应偏项bias term，通常不计入计算）
$+ λ 2 m \sum l = 1 L - 1 \sum i = 1 s l \sum j = 1 s (l + 1) (Θ (l) j i) 2$

0 0