Generative Adversarial Nets (GAN)解读

来源：互联网发布：默沙东临床数据管理员编辑：程序博客网时间：2024/05/18 00:41

会议：NIPS 2014

Introduction

GAN，生成对抗式网络是是Ian Goodfellow经典的大作，引起了很大的轰动，后面的各种GAN也层出不穷。追根溯源，为了了解GAN，需要从这篇开山之作说起。那GAN到底是什么？简单来说，GAN由两个模型组成，一个是生成模型G，一个是判别模型D，G负责从给定训练数据中学习数据的概率分布而D负责判别G生成出来的数据是不是符合真实数据的样本概率分布。两个网络是非合作关系，对于D来说，是要最大化能够判别出G生成的数据是假的的概率，而对于G来说，是要最小化被D判别出来的概率，在这个不断博弈的过程中，两个模型的能力都在变强，最后得到一个均衡。

首先要明确生成模型和判别模型的区别:

生成模型：学习到的是时联合概率密度分布P(X,Y)，从统计的角度来说就是学习数据的分布情况，反映同类数据之间的相似性；

判别模型：学习一个判别函数Y = f(x)或者条件概率P(Y|X)，并不能反映数据本身的特性，考虑的是异类数据之间的差异性，找到一个最佳分类面；

因此由生成模型可以到判别模型而判别模型不能到生成模型。

为了更好的理解GAN，可以类比警察与造假币商人，生成模型就类似于造假币的商人，试着造出被检测不出来的假币，而判别模型类比于警察，尝试检测出假币。在这个对抗过程中，两边的方法和水平都提高了，直到警察已经没有办法判别出假币，而某种程度上来说假币就是真的了。