深度残差网络（Deep Residual Learning ）

来源：互联网发布：java三大框架教程区别编辑：程序博客网时间：2024/06/05 19:51

纵观CNN领域网络的里程碑，最近深度残差网络ResNet

微软的深度残差网络ResNet源于2016年CVPR最佳论文---图像识别中的深度残差学习（Deep Residual Learning for Image Recognition）, 论文：pdf

这个152层ResNet架构深，除了在层数上面创纪录，ResNet 的错误率也低得惊人，达到了3.6%，人类都大约在5%~10%的水平。这是目前为止最好的深度学习框架。

一个能够用来训练“非常深”的深度网络又十分简洁的框架

试用领域：

图像分类

对象检测

语义分割

在五个主要任务轨迹中都获得了第一名的成绩：

ImageNet分类任务：“超级深”的152层网络

ImageNet检测任务：超过第二名16%

ImageNet定位任务：超过第二名27%

COCO检测任务：超过第二名11%

COCO分割任务：超过第二名12%

层数对比：

AlexNet, 8层 (ILSVRC 2012)

VGG, 19层 (ILSVRC 2014)

GoogleNet, 22层 (ILSVRC 2014)

ResNet，152层（ILSVRC 2015）

效果对比：

PASCAL VOC 2007——中间层数代表视觉识别的层数

HOG, DPM——浅层——34%的对象检测率

AlexNet (RCNN)——8层——58%的对象检测率

VGG (RCNN)——16层——66%的对象检测率

ResNet (Faster RCNN)——101层——86%的对象检测率

tutorial: http://www.leiphone.com/news/201608/vhqwt5eWmUsLBcnv.html?utm_source=tuicool&utm_medium=referral

0 0