Bounding-box Regression

来源:互联网 发布:网络诈骗贴吧 编辑:程序博客网 时间:2024/05/17 12:01

http://caffecn.cn/?/question/160

  R-CNN、Fast/Faster R-CNN 都训练了Bounding-box回归器对窗口进行校正,用于提高检测精度。


起因

  Region Proposal 得到的目标框不够准确,使其可能虽能被正确识别,但与 Groundtruth 相比 IoU 较小,故应对窗口进行微调。


问题

  寻找一种映射 f,使 f(Px,Py,Pw,Ph)=(Gx^,Gy^,Gw^,Gh^) ,且 G^G,其中 P 为原始 Proposal,G 为Groundtruth,G^ 为预测得到的更接近 G 的回归窗口。


方法

(1)平移变换:

Gx^=Px+Pwdx(P)(1)
Gy^=Py+Phdy(P)(2)

(2)尺度缩放:
Gw^=Pwexp(dw(P))(3)
Gh^=Phexp(dh(P))(4)

共需要学习 dx(P)dy(P)dw(P)dh(P) 四个变换。


设计

  当输入 Proposal 与 Groundtruth 相差较小时(R-CNN 中为 IoU>0.6),可以认为此变换为线性变换,可用线性回归来建模对窗口微调。


回归

  给定输入的特征向量 X,学习一组参数 W,使得 Y=WX 跟真实结果非常接近。

输入:

  Region Proposal对应的 CNN 特征(pool5features),在训练阶段,输入还包括Groundtruth,即 t=(tx,ty,tw,th)

输出:

  需要的平移变换和尺度变换: dx(P)dy(P)dw(P)dh(P)

训练:

  变换函数可以表示为 d(P)=wΦ5(P)x,y,w,h),Φ5(P) 为输入Proposal的特征向量,w 为要学习的参数,d(P) 为预测值,要让预测值与 Groundtruth 尽可能小,目标函数为:

w=argminw^iN(tiwT^ϕ5(Pi))2+λ||w^||(5)

  其中,平移量和缩放尺度 (tx,ty,tw,th) 分别为:
tx=(GxPx)/Pw(6)
ty=(GyPy)/Ph(7)
tw=log(Gw/Pw)(8)
th=log(Gh/Ph)(9)

然后利用梯度下降或最小二乘得到 w


测试

  根据学习到的回归参数 w,对于一幅新图像,首先经过 CNN 提取特征 Φ5(P),变化量预测即为 d(P)=wΦ5(P),最后根据(1)~(4)对目标框进行回归。

0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 专升本差两分怎么办 入职需要学士学位证怎么办 不喜欢写科研项目又没编制怎么办 易学堂密码忘了怎么办 易班手机号换了怎么办 易班登录不上怎么办 易到手机号换了怎么办 海外留学没有教育部认证怎么办 七过月宝宝便秘怎么办 6个月孩子便秘怎么办 6个月婴儿便秘怎么办 一个多月宝宝两天没拉大便怎么办 7个月宝宝便秘怎么办 9个月宝宝便秘怎么办 六个月宝宝严重便秘怎么办 公司调岗员工不同意怎么办 acca注册一直在审核怎么办 ieee ap二审被拒怎么办 文章投到假期刊怎么办 论文投了假网站怎么办 网上传了虚假的怎么办? 网上做兼职被骗了钱怎么办 通过支付宝扫码被骗了怎么办 支付宝扫二维码被骗怎么办 在is上被骗了怎么办 微信兼职被骗怎么办天涯论坛 公众号不给稿费怎么办 围绕服务改善民生提出怎么办 翰墨香林苑怎么办全产权 西城高铁联名卡怎么办 英语教学系统做题时超时了怎么办 sci被要求撤稿怎么办 论文投稿后初审通过想撤稿怎么办 河南大学读写译挂了怎么办 在职mba双证硕士怎么办户口 电脑开机了出现一些英文单词怎么办 不懂法语想读法语书怎么办 大鱼号文章需要修改怎么办 过了上诉期怎么办申诉 法院判刑后被告逃亡监护人怎么办 二审判决后不服的怎么办