GAN 入门

来源：互联网发布：知乎渡边信一郎编辑：程序博客网时间：2024/06/06 01:30

GAN入门
GAN的基本原理其实非常简单，这里以生成图片为例进行说明。假设我们有两个网络，G（Generator）和D（Discriminator）。正如它的名字所暗示的那样，它们的功能分别是：

D是一个判别网络，判别一张图片是不是“真实的”。它的输入参数是x，x代表一张图片，输出D（x）代表x为真实图片的概率，如果为1，就代表100%是真实的图片，而输出为0，就代表不可能是真实的图片。他的目标是D(x)=1 => max log(D(x))
G是一个生成图片的网络，它接收一个随机的噪声z，通过这个噪声生成图片，记做G(z)。它的目标是D(G(z))=1 ,=> min log(1-D(G(z))

而他们的优化公式是
优化公式1
他们的优化步骤是：

先对D进行k次优化，再对G进行优化。能避免过拟合，且保持D的最优。在实际工程中，为何避免早期的训练一直被拒绝，可以先优化 max D(G(z)),而非min log(1 − D(G(z)))

在训练后，D(G(z))=D(x)= 12.达到真假难分的效果.

其中，D 的最优公式应该是 DG(x)=pdata(x)pdata(x)+pg(x)
令 V(G,D)=∫xpdata(x)log(D(x))+py(x)log(1−D(x))dx
而
这里写图片描述

阅读全文

0 0