[CS231n] 第一讲：课程介绍

来源：互联网发布：java实用教程第四版pdf 编辑：程序博客网时间：2024/06/05 17:01

为什么选择这门课

——————————————————————————————————————————

作为在人工智能公司工作的AI小白，在今年7月份突然想了解和学习一下机器学习、深度学习（以防拖后腿）。所以从2017年7月份开始了AI学习之路。

2017年7月~8月，完成了吴恩达在Coursera上的课程《Machine learning》。

共11周的课程，每一课都有课堂练习。Week2~Week9，共有8次课后编程作业。编程作业设计的非常友好，我用Matlab独自完成了所有作业。

当时（8月24号: )）以98.4的分数完成了这门课，内心还是很激动的，对自己是一个正面的激励。

完成作业之后，想着如何进阶，但比较迷茫。和其他人谈起人工智能，还是分不清机器学习和深度学习有什么区别。

9月初，突然在知乎上看到了机器之心《斯坦福CS231n Spring 2017开放全部课程视频》，决定进阶就是这门课了。而且核算了一下，如果每周一节课，坚持上课，并加上完成Assignments的时间，正好可以在2017年底完成。内心的计划和目标简单且坚定。

而且，对这门课很倾心是有原因的。这门课会涉及到深度学习DNN方方面面的基本知识和概念，而且从当下应用最广的计算机视觉入手。真的是一门不错的课程。而且这门课的老师是李飞飞，大牛！（后来惊奇的发现，原来只有第一节课有飞飞…）

所以，立马将这门课推荐给了几位小伙伴，一起学习，每周一发布任务。

我的学习方式：①看第一遍视频，没有停顿；②结合ppt，看第二遍视频，同时做笔记。

通过这门课，学到了很多知识。同时有一些经典的文献，非常棒。作业也在借鉴别人的代码的情况下，完成了Assignment 1和部分Assignment 2。

基于此，开通了CSDN的帐号，在博客上记录和分享。

CS231n课程资料汇总

——————————————————————————————————————————

官方资料

课程主页：http://cs231n.stanford.edu/
每次课的内容，进度：http://cs231n.stanford.edu/syllabus.html
作业：http://cs231n.github.io/
男老师：1/2/3/7/8/10/11/12
女老师：4/5/6/9/13/14
客座：15/16

B站视频 + 慕课学院中文字幕【推荐】
B站视频（英文字幕）：https://www.bilibili.com/video/av13260183/?from=search&seid=6818791482506037637
慕课学院视频（中英文同步字幕）：http://www.mooc.ai/course/268

第一讲笔记（原创）

——————————————————————————————————————————

Lecture 1：Course Introduction

Computer vision overview
Historical context
Course logistics

第一讲：课程介绍

主要内容：计算机视觉综述

学习方式：视频 + 课件

计算机视觉综述

（1）视觉的出现造成了生物种类的大爆炸，530 million years ago。

（2）很早之前，人们开始了解机器视觉（mechanical vision），比如制作针孔相机（camera obcura）等。

（3）第9张幻灯片中提到了Hubel & Wiesel的通过研究猫进而研究人脑的视觉原理的实验。

相关参考文献：

Hubel DH and Wiesel TN (1998). Early exploration of the visual cortex. Neuron 20:401-12. 

Hubel D H. Tungsten Microelectrode for Recording from Single Units[J]. Science, 1957, 125(3247):549-550.

（4）人脑的视觉原理，对一张图片的认知，分成了几个步骤。（第13张幻灯片）

（5）人脸识别（face detection）的最早研究是2001年，这篇参考文献的被引用次数为15823。（第17张幻灯片）

参考文献：Jones M, Viola P. Robust real-time object detection[J]. International Journal of Computer Vision, 2001, 57(2):87.

（6）ImageNet和ImageNet LSVRC（Large Scale Visual Recognition Challenge）大赛

2012年，ImageNet LSVRC大赛的目标检测的错误率由25.8%下降到16.4,%，下降了10个百分点，是一个重大的转折点。

这个转折点的出现，正是因为CNN。

课程所需基础和课程内容

（1）机器学习。如果提前了解机器学习，那么在理解这门课的神经网络（NN，Neural Network）的相关内容时，会更容易一些，比如代价函数，梯度等概念。

（2）熟悉Python，尤其是Numpy。

（3）微积分和线性代数的基本知识。

（4）课程主题是视觉识别（visual recognition）中的图像分类（image classification），包括目标检测（object detection），图像描述（image captioning）等。

（5）CNN是解决（2）中提到的研究方向的重要方法。CNN的兴起不是一朝一夕之功。

（6）还有很多很多更有趣的视觉智能（visual intelligence），比如DeepDream等。

（完）

阅读全文

0 0