吴恩达深度学习笔记（四）week3目标检测

来源：互联网发布：华为网络管理平台价格编辑：程序博客网时间：2024/06/05 20:17

目标定位

目标分类、目标定位、目标检测的区别，目标分类与目标定位处理的图像只有一个目标，而目标检测有多个目标，目标分类输出只有一个，目标定位输出包括（目标是否存在，目标的坐标以及大小），目标检测需要把图片中的目标都检测出来。
这里写图片描述
关于目标定位的输出可以如下方式设置

特征点检测

当我们希望神经网络的输出能告诉我们图片中被检测对象的一些特征时，我们可以通过增加特征点作为神经网络的输出，如下图中识别图片人的表情和人的动作。
这里写图片描述

基于滑动窗口的目标检测

滑动窗口目标检测的原理很简单，如下图所示。用一个窗口遍历整张图片，之后每次遍历都可以增大窗口的大小。
这里写图片描述

卷积的滑动窗口实现

用卷积层代替全连接层

这里写图片描述

卷积的滑动窗口实现

这里写图片描述
以上图中间图片为例子，若输入图片大小为16×16×3滑动窗口的大小为14×14×3，若使用全连接，则需要进行四次计算，但是，可以看到，中间许多计算是重复的，使用卷积层代替全连接层后则只需一次计算，如图所示，输出单元的左上角即为第一个滑窗的输出…右下角单元即为最后一个滑窗。对于下面图片28×28×3也是一个道理，64个输出单元对应64个滑窗的输出。

阅读全文

0 0