cs231n笔记1

来源：互联网发布：avmoo最新域名2016 8 编辑：程序博客网时间：2024/06/05 19:51

斯坦福深度学习与机器视觉课程cs231n，感觉挺不错的，顺便记下来一些零碎的点，不过具体内容还是要参考笔记、视频。不过网易云课堂的视频还是有些问题的。

研究历史

一开始是对猫的视觉进行研究，发现有如下神奇的特点：

因此研究人员认为神经元对简单形状、边缘有反应。

David Marr提出视觉是分层的。

90年代感知分组，将图像分为不同区域。
1999，SIFT特征，图像识别、匹配。
2001，Face Detection，没有进行3D建模。

数据集：

2011年及之前图像分类识别基本靠SIFT+SVM。
其竞赛2012年出现CNN，AlexNet，7层layer夺得冠军。
之后2014：GoogleNet，VGG；2015：MSRA深度残差，均基于CNN。

两图像距离的定义。

超参数：无法在训练中优化，如距离定义、k值。
采用单一验证、交叉验证方法。

kNN流程：

公式：
$SVM$
j≠yi是指对于第i类，只对其他类进行求和运算；
sj是第j类得分结果；
syi是本类的得分结果；
Δ是常数，一般取1。
这是某一类的损失，总损失可以求平均。

image cat score car score frog score losses CAT 3.2 5.1 -1.7 2.9 CAR 1.3 4.9 2.0 0 FROG 2.2 2.5 -3.1 10.9

$regularization$
正则化项避免过拟合，考虑更多输入。

$loss$

公式：
$softmax$
$softmaxwithloss$
计算过程：

item cat car frog score 3.2 5.1 -1.7 exp 24.5 164.0 0.18 normalize 0.13 0.87 0

Lcat=−log(0.13)=0.89
当初始时（w很小），L=-log(1/N)=log(N)。

CS231n Convolutional Neural Networks for Visual Recognition
CS231n官方笔记授权翻译总集篇发布
斯坦福CS231n—深度学习与计算机视觉

0 0