GANアートにおける視覚的不確定性について - Visual indeterminacy in GAN art
Hertzmann, A. (2020) ‘Visual indeterminacy in GAN art’, Leonardo. MIT Press Journals, 53(4), pp. 424–428.
GANが生成する画像の「●●ぽいけど、なんか違う...」という「不確定性」に着目し、現代アートの特徴との比較を行った上で、今後のGANアートの将来像を探る。
2020
Overview
Can Computers Create Art? の筆者による論文。
GANが生成する画像の「●●ぽいけど、なんか違う...」という「不確定性」に着目し、現在アートの特徴との比較を行った上で、今後のGANアートの将来像を探る。
Abstract
This paper explores visual indeterminacy as a description for artwork created with Generative Adversarial Networks (GANs). Visual indeterminacy describes images that appear to depict real scenes, but on closer examination, defy coherent spatial interpretation. GAN models seem to be predisposed to producing indeterminate images, and indeterminacy is a key feature of much modern representational art, as well as most GAN art. The author hypothesizes that indeterminacy is a consequence of a powerful-but-imperfect image synthesis model that must combine general classes of objects, scenes and textures.
Background
Visual Indeterminacy
絵画においてVisual Indeterminacy/視覚的な不確定性は、鑑賞者に驚きを与える重要な要素。現代アートでは特に顕著 (例えば、Cubism)。
GANアートにおいても同様。GANでリアルな映像が生成できるようになっているが、そうしたものはアートとは言われない。不確定性(アーティストのMario Kliingemannの言葉によると「フランシス・ベーコン効果」)を持ったものがGANアートとして扱われる。一方で、有名なThe Obviousの作品のように単に「ぼやけている」ものやグロテスクなものとは区別する必要あり。
Discussion
なぜGANは不確定性のある画像を生成するのか
GANが複数の異なる要素を組み合わせて画像を生成していることがわかってきている。ただし、離散的ではなく連続的。境界がはっきりしない塗り絵の上で、水彩絵具で絵を描くようなもの → 不確定性が生まれる余地
GANモデルの精度
GANモデルの精度がある程度以上よくなると、こうした不確定性が生まれにくくなる。モデルの出力が不確定性の山を超えたときに、アーティストは次なる手法を試す必要が出てくる。
Mario Klingemannらは学習したモデルを意図的に「壊す」ことでこうした不確定性を導入することを試みている。
ニューロサイエンスの観点で人間の美的な体験を評価する神経美学の研究なども進んでいるが、そうした研究とAIの世界が結びついてくると、GANアーティストは、鑑賞者が認識する不確定性の度合いを意図的にコントロールするようなことが可能になるかもしれない。
Further Thoughts
- 音楽生成モデルでもこうした不確定性の観点から考えてみても良いかもしれない
- Creative Adversarial Networksについての言及がなかったのが意外
Links
GANモデルを意図的に壊す試みのサンプル
GANの画像生成の仕組みのビジュアライズ