深度残差网络(Deep Residual Learning )

来源:互联网 发布:java三大框架教程区别 编辑:程序博客网 时间:2024/06/05 19:51

纵观CNN领域网络的里程碑,最近深度残差网络ResNet

微软的深度残差网络ResNet源于2016年CVPR最佳论文---图像识别中的深度残差学习(Deep Residual Learning for Image Recognition),  论文:pdf

这个152层ResNet架构深,除了在层数上面创纪录,ResNet 的错误率也低得惊人,达到了3.6%,人类都大约在5%~10%的水平。这是目前为止最好的深度学习框架。

一个能够用来训练“非常深”的深度网络又十分简洁的框架

 

试用领域:

图像分类

对象检测

语义分割

 

在五个主要任务轨迹中都获得了第一名的成绩:

ImageNet分类任务:“超级深”的152层网络

ImageNet检测任务:超过第二名16%

ImageNet定位任务:超过第二名27%

COCO检测任务:超过第二名11%

COCO分割任务:超过第二名12%

 

层数对比:

AlexNet, 8层 (ILSVRC 2012)

VGG, 19层 (ILSVRC 2014)

GoogleNet, 22层 (ILSVRC 2014)

ResNet,152层(ILSVRC 2015)

 

效果对比:

PASCAL VOC 2007——中间层数代表视觉识别的层数

HOG, DPM——浅层——34%的对象检测率

AlexNet (RCNN)——8层——58%的对象检测率

VGG (RCNN)——16层——66%的对象检测率

ResNet (Faster RCNN)——101层——86%的对象检测率

 

tutorial: http://www.leiphone.com/news/201608/vhqwt5eWmUsLBcnv.html?utm_source=tuicool&utm_medium=referral

 

 

 

 

 

 

0 0
原创粉丝点击