[CS231n] 第一讲:课程介绍

来源:互联网 发布:java实用教程第四版pdf 编辑:程序博客网 时间:2024/06/05 17:01

为什么选择这门课

—————————————————————————————————————————

作为在人工智能公司工作的AI小白,在今年7月份突然想了解和学习一下机器学习、深度学习(以防拖后腿)。所以从2017年7月份开始了AI学习之路。

2017年7月~8月,完成了吴恩达在Coursera上的课程《Machine learning》
共11周的课程,每一课都有课堂练习。Week2~Week9,共有8次课后编程作业。编程作业设计的非常友好,我用Matlab独自完成了所有作业。
当时(8月24号: ))以98.4的分数完成了这门课,内心还是很激动的,对自己是一个正面的激励。

完成作业之后,想着如何进阶,但比较迷茫。和其他人谈起人工智能,还是分不清机器学习和深度学习有什么区别。

9月初,突然在知乎上看到了机器之心《斯坦福CS231n Spring 2017开放全部课程视频》,决定进阶就是这门课了。而且核算了一下,如果每周一节课,坚持上课,并加上完成Assignments的时间,正好可以在2017年底完成。内心的计划和目标简单且坚定。

而且,对这门课很倾心是有原因的。这门课会涉及到深度学习DNN方方面面的基本知识和概念,而且从当下应用最广的计算机视觉入手。真的是一门不错的课程。而且这门课的老师是李飞飞,大牛!(后来惊奇的发现,原来只有第一节课有飞飞…)

所以,立马将这门课推荐给了几位小伙伴,一起学习,每周一发布任务。
我的学习方式:①看第一遍视频,没有停顿;②结合ppt,看第二遍视频,同时做笔记。
通过这门课,学到了很多知识。同时有一些经典的文献,非常棒。作业也在借鉴别人的代码的情况下,完成了Assignment 1和部分Assignment 2。

基于此,开通了CSDN的帐号,在博客上记录和分享。


CS231n课程资料汇总

——————————————————————————————————————————

官方资料
  • 课程主页:http://cs231n.stanford.edu/
  • 每次课的内容,进度:http://cs231n.stanford.edu/syllabus.html
  • 作业:http://cs231n.github.io/
  • 男老师:1/2/3/7/8/10/11/12
  • 女老师:4/5/6/9/13/14
  • 客座:15/16

B站视频 + 慕课学院中文字幕【推荐】
  • B站视频(英文字幕):https://www.bilibili.com/video/av13260183/?from=search&seid=6818791482506037637
  • 慕课学院视频(中英文同步字幕):http://www.mooc.ai/course/268


第一讲笔记(原创)

——————————————————————————————————————————
  • Lecture 1:Course Introduction
Computer vision overview 
Historical context 
Course logistics
第一讲:课程介绍
主要内容:计算机视觉综述
学习方式:视频 + 课件

  • 计算机视觉综述
(1)视觉的出现造成了生物种类的大爆炸,530 million years ago。
(2)很早之前,人们开始了解机器视觉(mechanical vision),比如制作针孔相机(camera obcura)等。
(3)第9张幻灯片中提到了Hubel & Wiesel的通过研究猫进而研究人脑的视觉原理的实验。
相关参考文献:
Hubel DH and Wiesel TN (1998). Early exploration of the visual cortex. Neuron 20:401-12. 
Hubel D H. Tungsten Microelectrode for Recording from Single Units[J]. Science, 1957, 125(3247):549-550.
(4)人脑的视觉原理,对一张图片的认知,分成了几个步骤。(第13张幻灯片)
(5)人脸识别(face detection)的最早研究是2001年,这篇参考文献的被引用次数为15823。(第17张幻灯片)
参考文献:Jones M, Viola P. Robust real-time object detection[J]. International Journal of Computer Vision, 2001, 57(2):87.
(6)ImageNet和ImageNet LSVRC(Large Scale Visual Recognition Challenge)大赛
2012年,ImageNet LSVRC大赛的目标检测的错误率由25.8%下降到16.4,%,下降了10个百分点,是一个重大的转折点。
这个转折点的出现,正是因为CNN。


  • 课程所需基础和课程内容
(1)机器学习。如果提前了解机器学习,那么在理解这门课的神经网络(NN,Neural Network)的相关内容时,会更容易一些,比如代价函数,梯度等概念。
(2)熟悉Python,尤其是Numpy。
(3)微积分和线性代数的基本知识。
(4)课程主题是视觉识别(visual recognition)中的图像分类(image classification),包括目标检测(object detection),图像描述(image captioning)等。
(5)CNN是解决(2)中提到的研究方向的重要方法。CNN的兴起不是一朝一夕之功。

(6)还有很多很多更有趣的视觉智能(visual intelligence),比如DeepDream等。

(完)
原创粉丝点击