GAN 入门

来源:互联网 发布:知乎 渡边信一郎 编辑:程序博客网 时间:2024/06/06 01:30

GAN入门
GAN的基本原理其实非常简单,这里以生成图片为例进行说明。假设我们有两个网络,G(Generator)和D(Discriminator)。正如它的名字所暗示的那样,它们的功能分别是:

  • D是一个判别网络,判别一张图片是不是“真实的”。它的输入参数是x,x代表一张图片,输出D(x)代表x为真实图片的概率,如果为1,就代表100%是真实的图片,而输出为0,就代表不可能是真实的图片。他的目标是D(x)=1 => max log(D(x))
  • G是一个生成图片的网络,它接收一个随机的噪声z,通过这个噪声生成图片,记做G(z)。它的目标是D(G(z))=1 ,=> min log(1-D(G(z))

而他们的优化公式是
优化公式1
他们的优化步骤是:
优化步骤
先对D进行k次优化,再对G进行优化。能避免过拟合,且保持D的最优。在实际工程中,为何避免早期的训练一直被拒绝,可以先优化 max D(G(z)),而非min log(1 − D(G(z)))

在训练后,D(G(z))=D(x)= 12.达到真假难分的效果.

其中,D 的最优公式应该是 DG(x)=pdata(x)pdata(x)+pg(x)
V(G,D)=xpdata(x)log(D(x))+py(x)log(1D(x))dx

这里写图片描述

原创粉丝点击