【论文笔记】Deep Neural Networks for Object Detection

来源:互联网 发布:苹果5s不能使用4g网络 编辑:程序博客网 时间:2024/05/13 08:12
论文:<<Deep Neural Networks for Object Detection>>
      作者
:Christian Szegedy Alexander Toshev Dumitru Erhan

来源: Google
是否开放代码: 否
主要思想:利用DNN来做目标检测,因为现在的CNN等深度学习在识别上面做的还挺好,但是在目标检测上面,好像没有特别突出的结果。目标检测 = 目标识别 +目标定位;
本文中作者把目标检测看做一个回归问题,回归目标窗口(
BoundingBox)的位置,
寻找一张图片当中目标类别和目标出现的位置。
当前的目标检测方法效果比较好的是
DPM(可变形部分模型)模型,建立在目标表示和目标可分解为由多个Part组成的模型,它是一种图模型,利用判别性学习这种图模型在目标检测中取得了不错的结果。

目标检测最重要的问题:1.大小(分辨率) 2.如何不滑动窗口来做(滑动窗口实在是太慢了)。
文章说明了:
1. 基于DNN的回归不但可以学习有利于分类的特征,同时它也能够捕获到目标的几何信息;

 

主要内容
通过设计基于
DNN的回归,它的输出为二值化mask(掩码?反正就是来表示目标的位置信息),并且实现了从掩码中提取检测到的目标窗口,利用DNN的掩码回归问题中,即考虑到了完整图像的多尺度问题,同时也考虑到了一些小数量的图像裁剪块,然后以此精化;

 

在实现中,作者基于NIPS2012ImageNet那篇,直接把最后一层替换为回归层。

 

其它的基于DNN的检测方法或多或少是基于局部或者半局部分类器来做的,这这篇文章中采用的是利用整幅图像作为输入,然后通过位置回归来做的,这样的方法显然比滑动窗口的方法来说更加的高效;
 

对于存在的三个问题:1 .单个掩码可能区分开那些相互靠近的目标,2.由于输出大小的限制,产生的掩码会比原始图像小很多,所以这样就不能够精确的定位,3.因为输入是整张图像,一些小的图片能够影响到的输入神经元很少,所以将导致不易识别;

 

1.为了解决第一个问题:目标相互靠近的情况:
作者生成多个掩码,每个掩码表示着对应的完整的目标或者部分目标,他们使用一个网络来预测目标窗口掩码,使用
4个附加的网络来检测4个半部分窗口,上下左右。这5个预测的结果是过完全的,但是可以减少不确定性和一些掩码错误。这样当有两个相同对象靠近出现在图像中时,产生的5个掩码至少有两个是不会合并在一起的,这样就可以区分开不同的目标;


==========================================

未完~~

0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 江苏移动没实名认证停机了怎么办呀 亿达老年手机来电音量太大怎么办 挑三十六乘二的内螺纹丝瞳毛怎么办 内六角螺丝的冒滑了怎么办 孔里的内六角滑了怎么办 十字螺丝刀的头卡在螺母里怎么办 内六角扳手断在螺丝孔里怎么办 六棱螺丝刀折进螺丝里了怎么办 内6棱螺丝拧花了怎么办 只有pe模式可以用键盘鼠标怎么办 电脑重做了系统连不上无线网怎么办 联想手机死机了怎么办不可拆卸电池 手机界面弹出后大小无法调整怎么办 方向盘打方向瑟瑟的吱吱响怎么办 三脚架提升杆螺丝滑丝了怎么办 花土里面有很多细长的螺丝怎么办 防盗门外边上边缝宽螺丝松了怎么办 填充墙与框架梁不对齐怎么办 亚轧滚珠丝杠螺帽超程了怎么办 在公司交的五险一金辞职了怎么办 铝合金的渣子整到眼睛里怎么办 铁锅手柄上的铆钉拧不动怎么办 喂完鱼鱼缸上边飘着一层油膜怎么办 铸铁管道横着排的结口漏水怎么办 缤智行李架免打孔螺丝款怎么办 前保险杠和叶子板缝隙大怎么办 新奥拓的大灯调节螺丝滑丝了怎么办 小米手环2计步不准怎么办 小米手环3计步不准怎么办 眼镜用洗发水洗了后模糊怎么办 雷朋近视镜眼镜腿折了怎么办 近视镜眼镜腿断了该怎么办 老师把学生的眼镜打坏了怎么办 生死狙击忘了密保改不了密码怎么办 我叫mt狂猎之弓怎么办 你能利用你的弱点打击你怎么办 研控两相混合伺服电机反转怎么办? 战地一要我升级显卡驱动怎么办 刺客信条兄弟会存档损坏了怎么办 电脑上所有软件和文件被删了怎么办 电脑显示文件已打开无法删除怎么办