Tag: visual

Tag: visual

💾
References: AI

👨‍👩‍👦
もしAIが「へのへのもへじ」を作ったら? — CLIPと進化戦略を用いたコラージュ画像の生成

2021

画像とテキストがどれくらいマッチしているかを定量化するCLIPモデルを用いて、要素画像の配置を最適化。入力されたテキストにあったコラージュ画像を生成するシステム

CLIP-guided collage image optimization using Evolutionary Strategy

Project
visualcross-modal
December 11, 2021
👨‍👩‍👦
Botto—コミュニティのフィードバックに基づいてNFTアートを自動生成するBot

2021

CLIP+VQ-GANの仕組みを活用

Botto Project

Project
artvisualGAN
November 19, 2021
📄
Visual indeterminacy in GAN art

2020

GANが生成する画像の「●●ぽいけど、なんか違う...」という「不確定性」に着目し、現代アートの特徴との比較を行った上で、今後のGANアートの将来像を探る。

Hertzmann, A. (2020) ‘Visual indeterminacy in GAN art’, Leonardo. MIT Press Journals, 53(4), pp. 424–428.

Paper
arttheoryGANvisual
May 19, 2021
📄
Generating Long Sequences with Sparse Transformers

2019

スパースなTransformerの仕組みで計算量を抑える

Child, R. et al. (2019) ‘Generating Long Sequences with Sparse Transformers’, arXiv. arXiv. Available at: http://arxiv.org/abs/1904.10509 (Accessed: 29 January 2021).

Paper
musicvisualaudio
May 16, 2021
💽
ArtEmis: Affective Language for Visual Art

2021

8万枚の絵画にクラウドソーシングで44万の言語情報を付加。

ArtEmis: Affective Language for Visual Art

Dataset
visualart
April 22, 2021
⚒️
CinemaNet

普通の画像認識モデルのようなオブジェクトの識別に加えて、カメラのアングルやフォーカスの当て方(ソフトフォーカス...)、撮影された時間帯(夕方、朝焼け)、場所などをタグ付け

CinemaNet by Anton Marini(vade), Rahul Somani

Tool
visual
March 3, 2021
AIを用いたAudio Visual – Stylizing Audio Reactive Visuals

2019

Han-Hung Lee, Da-Gin Wu, and Hwann-Tzong Chen, "Stylizing Audio Reactive Visuals", NeurlPS2019, (2019)

Paper
visualGAN
June 24, 2020
📄
様々なメディアのフレームを補間する – Depth-Aware Video Frame Interpolation

2020

様々なメディアのフレームを補間する – Depth-Aware Video Frame Interpolation

Paper
imagevisual
February 4, 2020
📄
音と映像の関係性の学習 – Audio-Visual Scene Analysis with Self-Supervised Multisensory Features

2018

Audio-Visual Scene Analysis with Self-Supervised Multisensory Features

Paper
soundvisual
May 20, 2018
📄
動画からそれにあった音を生成 – Visual to Sound: Generating Natural Sound for Videos in the Wild

2018

Visual to Sound: Generating Natural Sound for Videos in the Wild

Paper
soundvisual
January 3, 2018
📄
画像から、好みのメッシュの3Dモデルを作成する -Neural 3D Mesh Renderer-

2017

Neural 3D Mesh Renderer

Paper
visualimage
November 25, 2017
💾
人の行動の動画データセット – AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions

2017

AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions

Dataset
visualimage
October 23, 2017
👨‍👩‍👦
機械とともに描くポートレート – Delusions

2017

Delusions

demo
performancevisualimage
October 20, 2017
👨‍👩‍👦
顔写真から3Dモデルを生成 – Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric CNN Regression

2017

Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric CNN Regression

demo
artvisualimage
September 29, 2017
💾
動植物の画像データセット – The iNaturalist Challenge 2017 Dataset

2017

The iNaturalist Challenge 2017 Dataset

Dataset
visual
July 23, 2017
📄
過去の作品を学習することで本当に新しい作品が作れるのか?? – CAN: Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms

2017

CAN: Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms

Paper
GANartvisual
June 29, 2017
📄
人工知能の力を借り、3Dモデルを共作する – Interactive 3D Modeling with a Generative Adversarial Network –

2017

Interactive 3D Modeling with a Generative Adversarial Network

demo
visualGAN
June 25, 2017
📄
画像⇆音の生成 – Deep Cross-Modal Audio-Visual GenerationDeep Cross-Modal Audio-Visual Generation

2017

Deep Cross-Modal Audio-Visual Generation

Paper
visualsound
May 14, 2017
💾
車載カメラ画像データセット – Mapillary Vistas Dataset

2017

Mapillary Vistas Dataset

Dataset
visual
May 4, 2017
📄
適切なフォントの組み合わせを生成 – Fontjoy

2017

適切なフォントの組み合わせを生成 – Fontjoy

適切なフォントの組み合わせを生成 – Fontjoy

demo
visual
April 30, 2017
👨‍👩‍👦
未来を予測して動画を生成 – Generating Videos with Scene Dynamics –

2017

Generating Videos with Scene Dynamics

Project
visualimage
April 30, 2017
📄
一枚の写真からその後の人の動きを予測 – Forecasting Human Dynamics from Static Images

2017

Forecasting Human Dynamics from Static Images

Paper
visualimageperformance
April 25, 2017
📄
横顔から正面から見た顔を生成 – Beyond Face Rotation: Global and Local Perception GAN for Photorealistic and Identity Preserving Frontal View Synthesis

2017

Beyond Face Rotation: Global and Local Perception GAN for Photorealistic and Identity Preserving Frontal View Synthesis

Paper
GANvisual
April 18, 2017
👨‍👩‍👦
機械学習を用いたドラムマシン – The Infinite Drum Machine : Thousands of everyday sounds, organized using machine learning.

2017

The Infinite Drum Machine : Thousands of everyday sounds, organized using machine learning

Project
musicvisualsound
April 7, 2017
📄
見えない体を見る. 一人称視点の映像からカメラをつけている人の姿勢を推定. – Seeing Invisible Poses: Estimating 3D Body Pose from Egocentric Video

2017

Seeing Invisible Poses: Estimating 3D Body Pose from Egocentric Video

Paper
visualimage
April 6, 2017
📄
Attributesによる画像の美しさ判定 – Photo Aesthetics Ranking Network with Attributes and Content Adaptation

2017

Photo Aesthetics Ranking Network with Attributes and Content Adaptation

Paper
visualimage
April 4, 2017
📄
CycleGAN 対訳がなくても画像を翻訳(変換) – Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

2017

Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

Project
visualimage
April 1, 2017
📄
ストリートビューの画像の解析による人口統計調査 – Using Deep Learning and Google Street View to Estimate the Demographic Makeup of the US

2017

Using Deep Learning and Google Street View to Estimate the Demographic Makeup of the US

Paper
visualimage
March 31, 2017
📄
ファッション・トレンドの解析. 東京は… – Changing Fashion Cultures

2017

Changing Fashion Cultures

Paper
visualart
March 29, 2017
📄
写真のStyle Transfer- Deep Photo Style Transfer

2017

Deep Photo Style Transfer

Paper
visualimage
March 25, 2017
👨‍👩‍👦
目が回ります – DeepWarp: Photorealistic Image Resynthesis for Gaze Manipulation

2017

DeepWarp: Photorealistic Image Resynthesis for Gaze Manipulation

demo
visual
March 19, 2017
📄
DeepDreamを用いたのドローイングツール- DreamCanvas

2017

DeepDreamを用いたのドローイングツール- DreamCanvas

DeepDreamを用いたのドローイングツール- DreamCanvas

demo
visual
March 15, 2017
📄
フォントのStyle Transfer? – Awesome Typography: Statistics-Based Text Effects Transfer

2017

YANG, Shuai, et al. "Awesome typography: Statistics-based text effects transfer", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp.7464-7473, (2017)

Paper
visualimage
February 5, 2017
📄
AENet: Learning Deep Audio Features for Video Analysis

2017

AENet: Learning Deep Audio Features for Video Analysis

Paper
visualmusic
January 20, 2017
👨‍👩‍👦
T-SNE MAP – Google Arts and Culture Experiments

2016

T-SNE MAP – Google Arts and Culture Experiments

Project
performancevisual
January 13, 2017
📄
Unsupervised Learning of 3D Structure from Images

2016

Unsupervised Learning of 3D Structure from Images

Paper
visualimage
December 6, 2016