论文阅读Synthetic to Real Adaptation with Generative Correlation Alignment Networks
来源:互联网 发布:linux根目录创建文件 编辑:程序博客网 时间:2024/05/21 22:41
论文题目:Synthetic to Real Adaptation with Generative Correlation Alignment Networks
作者:Xingchao Peng,Kate Saenko
来源: arxiv2017
1. 摘要
文章的想法是如果使用3D CAD建模的合成图片进行训练数据的数据增强,将会是一件非常有意义的事。然而,合成图片与真实图片之间存在较大的domain discrepancy,所以直接使用的效果甚微。本文提出了一种DGCAN的网络结构,使用shape preserving loss和low level statistic matching loss来减小特征空间中域之间的差异。
具体的,CAD合成图片具有很大的非真实性,其原因如下:
1)前景与背景的不匹配性很大
2)物体边缘和背景之间有很大的对比度
3)不逼真的场景
以上原因导致了合成图片与真实图片有很大的域差异
2. 文章的思路
2.1 总体的思路
上图是总体的方法概略,使用DGCAN(Deep Generative Correlation Alignment Network)来生成inexpensive annotated training data。通过
综合物体的形状(从易获取的3D CAD中得到)以及结构纹理(从少量的真实图片中获得),最终在DGCAN-合成图片上进行训练,其效果有很大的改善。
设
为了从
2.2 DGCAN的实现
使用VGG-16作为基础架构,包含13个卷积层(conv1_1-conv5_3),3个全连接层(fc6-fc8),5个pooling层(pool1-pool5)。
令
第一个loss是为了保证物体的轮廓保持一致,第二个Loss是为了图像与真实图片有相似的low-level的特征。
2.2.1 shape preserving loss
其中
该loss关于激活值的导数是
2.2.2 naturalness loss
为了使生成的图片具有与真实图片相似的low-level的特征(纹理,边缘对比度,颜色等),这里使用了CORAL loss。Correlation Alignment(CORAL) 是[1]论文中提出的loss。用于match the second-order statistics of feature distributions for domain adaptation。
其中
参考原论文,协方差矩阵如下:
其中
利用链式法则对CORAL求导得导数为:
最后总的loss是将两个结合起来。先对原始图像增加一个扰动
2.3 实验结果
实验分两部分:1)用CAD合成图片和真实图片一起生成DGCAN合成图片;2)用现有的分类器在DGCAN合成图上进行训练
上图展示了根据两个输入(source domain:CAD合成图,target domain:真实图片)而产生的合成图。
1) 把
2)改变trade-off参数
左侧的一组图是CAD合成图和它对应的生成好的DGCAN合成图,可以看到着色后的图片具有真实的图像轮廓和真实的纹理。使用【2】中的工具进行图像可视化处理。可以发现,DGCAN的合成图片与真实图片的差异较小。而单一的灰度图像(CAD合成图)仅提供了边缘信息(edge information).
左边的图不太懂(confusion matrix),大概理解是DGCAN合成图的错误模式和CAD合成图的错误模式大大不同,右图是t-SNE可视化的效果,可以得出DGCAN-合成图与原图的domian shift更小
3.参考文献
[1] B. Sun, J. Feng, and K. Saenko. Return of frustratingly easy domain adaptation. arXiv preprint arXiv:1511.05547, 2015. 1, 2, 4, 6, 7, 8
[2]A. Mahendran and A. Vedaldi. Visualizing deep convolutional neural networks using natural pre-images. International Journal ofComputer Vision, pages 1–23, 2016. 5