SSD理解

来源:互联网 发布:软件项目估算表 编辑:程序博客网 时间:2024/05/16 08:48

default boxes=prior box 6个不同比例框

1,多尺度特征图检测网络结构
模型建立源代码包含于ssd_vgg_300.py中。模型多尺度特征图检测如图1-2所示。模型选择的特征图包括:38×38(block4),19×19(block7),10×10(block8),5×5(block9),3×3(block10),1×1(block11)。采用3×3卷积生成默认框的四个偏移位置和21个类别的置信度。比如block7,默认框(def boxes)数目为6,每个默认框包含4个偏移位置和21个类别置信度(4+21)。因此,block7的最后输出为(19*19)6(4+21)。
2,anchor box生成
对每一张特征图,按照不同的大小(scale) 和长宽比(ratio) 生成生成k个默认框(default boxes),
默认框数目k=6,其中5×5的红色点代表特征图,因此:5*5*6 = 150 个boxes
具体到每一个feature map上获得prior box时,会从这6种中进行选择。如下表和图所示最后会得到(38*38*4 + 19*19*6 + 10*10*6 + 5*5*6 + 3*3*4 + 1*1*4)= 8732个prior box。
这里写图片描述
上图中的step=layer_width/img_width
offset就是论文中的0.5
这里写图片描述
clip:把得到的priorbox坐标裁剪到[0,1]
3,代码中的4个variance分别对应4个坐标:xmin,ymin,xmax,ymax

flatten and permute
这里写图片描述

原创粉丝点击