《YOLO9000:Better,Faster,Stronger》笔记

来源:互联网 发布:中科院软件所怎么样 编辑:程序博客网 时间:2024/06/06 03:08
  1. 简介
  2. Better
    2.1 Batch Normalization
    CNN在训练的过程中,每层的输入分布一直在改变,这会使得训练难度加大。在所有的卷积层中加入BN可以规范化输入,提高网络的收敛性,同时消除了网络对其他形式正则化的依赖(丢弃Dropout)。mAP有了2%的提升。
    2.2 High Resolution Classifier
    业界的对目标检测网络的标准做法,都会将classifier在ImageNet做pretrain。从AlexNet网络开始,大多数classifier的input都小于256*256,YOLO的input也是224*224,这样对图片做resize导致分辨率不高。YOLOv2将input提升到448*448,在ImageNet数据集上调优classifier 10个epoch,去适应高分辨率的输入,然后再调优用于检测resulting network。mAP有了4%的提升。
    2.3 Convolutional With Anchors Boxes.
    YOLO使用全连接层来预测bbox,损失了像素之间的空间信息。
阅读全文
0 0
原创粉丝点击