Improved Training of Wasserstein GANs

Wasserstein GANの改良：勾配ペナルティの導入

この論文は、Generative Adversarial Networks (GANs)の一種であるWasserstein GAN (WGAN)の改良版を提案しています。従来のWGANの問題点を指摘し、新しい手法を導入することで、より安定した学習と高品質な生成結果を実現しています。

著者らは、WGANで使用される重みクリッピングに以下の問題があると指摘しています：

これらの問題を示すために、著者らはいくつかの実験を行いました。

Figure 1: 重みクリッピングと勾配ペナルティの比較

著者らは、重みクリッピングの代わりに「勾配ペナルティ」を導入することを提案しています。

新しい目的関数は以下のようになります：

L = E[D(x̃)] - E[D(x)] + λ * E[(||∇D(x̂)||_2 - 1)^2]

ここで、x̂はデータ分布と生成分布の間の直線上からランダムにサンプリングされたポイントです。

著者らは、提案手法の有効性を示すためにいくつかの実験を行いました。

200種類のランダムなアーキテクチャを生成し、従来のGANとWGAN-GPで学習を行いました。結果として、WGAN-GPの方が多くのアーキテクチャで成功しました。

6種類の異なるアーキテクチャを用いて、LSUN寝室データセットで学習を行いました。WGAN-GPのみがすべてのアーキテクチャで安定した学習を実現しました。

CIFAR-10データセットを用いて、Inception scoreを計算し、他の手法と比較しました。WGAN-GPは教師なし学習の中で最高のスコアを達成しました。

文字レベルの言語モデルを学習させ、WGAN-GPが離散データの生成にも適用可能であることを示しました。

WGAN-GPは、従来のWGANの問題点を解決し、より安定した学習と高品質な生成を実現する手法です。様々なタスクやアーキテクチャに適用可能であり、GANの研究に新たな可能性を開きました。

この改良により、GANの応用範囲がさらに広がることが期待されます。