《Generative Adversarial Text to Image Synthesis》阅读理解
来源:互联网 发布:mac版ps怎么下载 编辑:程序博客网 时间:2024/06/05 17:43
1.简介
从文本描述自动合成真实的图像,也就是把人类所写的一句描述性文本翻译成一系列像素点。例如,“this small bird has a short, pointy orange beak and white belly” 或者 ”the petals of this flower are pink and the anther are yellow”。下图是一个从文本描述生成图像的例子。
目标:学习一个映射直接把单词和字符转换成图像像素。两步走:首先,捕获重要的视觉细节用来学习一个文本的特征表示;其次,使用这些特征去合成一个人类难分真假的图像。
贡献:设计了一个简单有效的生成对抗网络(GAN)框架,并制定了一个训练策略能够用描述性的文本去合成关于花鸟的图像。
数据集: Caltech-UCSD Birds dataset(鸟);Oxford-102 Flowers dataset(花);甚至MS COCO dataset(普通图像)。
注:每张图片都对应有五个描述文本。
2.背景
生成对抗网络
生成对抗网络包括一个生成器(
Deep symmetric structured joint embedding
3.深度卷积生成对抗网络(DC-GAN)
定义:
生成器网络
Matching-aware discriminator (GAN-CLS)
对于判别器
算法1总结了训练过程:
Learning with manifold interpolation (GAN-INT)
对训练文本编码进行简单插值,从而能产生大量的文本编码(虽然这些编码不对应任何真实文本),这样就不需要额外的标记开销。对于生成器优化目标函数,就是加入了一个额外项,如下:
Inverting the generator for style transfer
逆转生成器用于风格转换
4.实验
- CUB数据集包含11788张鸟图片,属于200个类;
- Oxford-102数据集包含8189张花图片,属于102个类。
图片合成
GAN和GAN-CLS获得的颜色信息正确,但图像看起来不真实;GAN-INT和GAN-INT-CLS生成的图片更合理,且符合部分甚至全部注释文本。如下图,
风格转换
风格转换过程如下,也就是输入一张图片
实验结果如下:
后续实验
本篇论文还通过插值文本编码
除了做花鸟实验,还在其他自然生活图像上实验,如下图,
- 《Generative Adversarial Text to Image Synthesis》阅读理解
- Generative Adversarial Text to Image Synthesis --- 根据文字描述生成对应的图片
- 阅读小结:Generative Adversarial Nets
- 《Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network》阅读笔记
- 《Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network》阅读笔记
- GENERATIVE ADVERSARIAL NETWORKS FOR IMAGE STEGANOGRAPHY
- Coupled Generative Adversarial Networks 阅读笔记
- Generative Adversarial Nets (GAN) 阅读笔记
- 论文阅读:Learning to Discover Cross-Domain Relations with Generative Adversarial Networks
- 【Paper Note】Generative Adversarial Nets 论文理解
- 『论文阅读』Image-to-Image Translation with Conditional Adversarial Networks
- ICCV2017论文“Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks” 阅读笔记
- 论文笔记:Precomputed Real-Time Texture Synthesis with Markovian Generative Adversarial Networks
- Precomputed Real-Time Texture Synthesis with Markovian Generative Adversarial Networks论文笔记
- 阅读小结:Unsupervised Representation with Deep Convolutional Generative Adversarial Networks
- BEGAN: Boundary Equilibrium Generative Adversarial Networks阅读笔记
- Generative Adversarial Networks 生成对抗网络的简单理解
- Generative Adversarial Networks 生成对抗网络的简单理解
- 百度语音SDK开发,姐妹篇~iOS-Demo
- maven 创建oracle
- Windows 10和Ubuntu双系统下,Windows可以正常联网,Ubuntu无法连接。
- Java实现选择排序
- Android中用网络请求数据方法,判断用户注册并跳转
- 《Generative Adversarial Text to Image Synthesis》阅读理解
- Visual Basic 对象Refresh的方法IAdodc失败
- javascript.dom-document对象
- 浅谈知识图谱基础
- Redis五种数据类型介绍
- Mysql集群和一主多从的方案实现(一)
- 大数据实时推荐-不只是统计
- 磁盘共享之cifs
- Python基础入门:List与Tuple、Dict与Set之间的比较