AIの「エラー」がひらめきを生む:不完全性をデザイン発想の味方に
Nao Tokui
AIの「エラー」がひらめきを生む:不完全性をデザイン発想の味方に
www.researchgate.net
@June 18, 2024 9:30 PM (GMT+1)
絵画を知らないAIが絵画を生成できるか — Art-free Diffusion
Nao Tokui
絵画を知らないAIが絵画を生成できるか — Art-free Diffusion
arxiv.org
2024
WavJourney - LLMで複数のモデルを組み合わせて、テキスト入力からオーディオコンテンツを生成
Nao Tokui
WavJourney - LLMで複数のモデルを組み合わせて、テキスト入力からオーディオコンテンツを生成
arxiv.org
2023
音楽生成AIは本当に新しい音楽を生成しているか? 学習データをコピーしているだけではないか? - 定量的な調査
Nao Tokui
音楽生成AIは本当に新しい音楽を生成しているか? 学習データをコピーしているだけではないか? - 定量的な調査
arxiv.org
2024
Active Divergenceのサーベイ — 学習データの忠実な再現からの適度な逸脱を目指して
Nao Tokui
Active Divergenceのサーベイ — 学習データの忠実な再現からの適度な逸脱を目指して
arxiv.org
2021
GLAZE: ぱっと見にはわからないノイズを画像に追加することで、拡散モデルを用いたスタイルの模倣を困難にする仕組み
Nao Tokui
GLAZE: ぱっと見にはわからないノイズを画像に追加することで、拡散モデルを用いたスタイルの模倣を困難にする仕組み
arxiv.org
2023
AudioLDM: latent diffusionを用いてテキストからオーディオ(環境音、音楽等)を生成するモデル
Nao Tokui
AudioLDM: latent diffusionを用いてテキストからオーディオ(環境音、音楽等)を生成するモデル
arxiv.org
2023
Datasets That Are Not — 新奇性の高い出力を求めたデータセットのAugmentation手法
Nao Tokui
Datasets That Are Not — 新奇性の高い出力を求めたデータセットのAugmentation手法
2022
それっぽさと新奇性、それぞれを最大化するGANモデルを用いた音楽生成 — Musicality-Novelty GAN
Nao Tokui
それっぽさと新奇性、それぞれを最大化するGANモデルを用いた音楽生成 — Musicality-Novelty GAN
2018
深層学習を用いたウェーブ・シェーピング合成 - NEURAL WAVESHAPING SYNTHESIS
Nao Tokui
深層学習を用いたウェーブ・シェーピング合成 - NEURAL WAVESHAPING SYNTHESIS
arxiv.org
2021
Musical Tempo and Key Estimation using CNNs with Directional Filters
Bogdan Teleaga
Musical Tempo and Key Estimation using CNNs with Directional Filters
arxiv.org
2019
もしAIが「へのへのもへじ」を作ったら? — CLIPと進化戦略を用いたコラージュ画像の生成
Nao Tokui
もしAIが「へのへのもへじ」を作ったら? — CLIPと進化戦略を用いたコラージュ画像の生成
2021
X線スキャンとStyle Transferでキャンバスに隠された絵画を「復元」するプロジェクト
Nao Tokui
X線スキャンとStyle Transferでキャンバスに隠された絵画を「復元」するプロジェクト
arxiv.org
2019
CLIPと進化戦略ESを用いて、単純なかたちを組み合わせて描く抽象画. AIキュビズム ? 
Nao Tokui
CLIPと進化戦略ESを用いて、単純なかたちを組み合わせて描く抽象画. AIキュビズム ?
2021
FakeAVCeleb - ディープフェイク技術で作った顔と話し声のデータセット
Nao Tokui
FakeAVCeleb - ディープフェイク技術で作った顔と話し声のデータセット
arxiv.org
2021
synth1B1 - 10億以上のシンセ音と、そのパラメータがペアになったデータセット
Nao Tokui
synth1B1 - 10億以上のシンセ音と、そのパラメータがペアになったデータセット
arxiv.org
2021
The Flemish Scrollers - 議会中にサボっている議員を監視するボット
Nao Tokui
The Flemish Scrollers - 議会中にサボっている議員を監視するボット
2021
Neural Loop Combiner — リズム、メロディー、ベースライン... どのループを組み合わせる? 
Nao Tokui
Neural Loop Combiner — リズム、メロディー、ベースライン... どのループを組み合わせる?
arxiv.org
2020
Algorithms of Late-Capitalism — 行き過ぎた資本主義社会におけるAI/アルゴリズムの利用に光を当てるZine/Webサイト 
Nao Tokui
Algorithms of Late-Capitalism — 行き過ぎた資本主義社会におけるAI/アルゴリズムの利用に光を当てるZine/Webサイト
2020
結局AI音楽ツールって使えるの? AI音楽ツールに対する意識調査- A survey on the uptake of Music AI Software
Nao Tokui
結局AI音楽ツールって使えるの? AI音楽ツールに対する意識調査- A survey on the uptake of Music AI Software
2020
演奏者が自身の姿と音を学習したAIと向き合うオーディオビジュアルパフォーマンス: Alexander Schubert - Convergence 
Nao Tokui
演奏者が自身の姿と音を学習したAIと向き合うオーディオビジュアルパフォーマンス: Alexander Schubert - Convergence
2020
Energy and Policy Considerations for Deep Learning in NLP
Nao Tokui
Energy and Policy Considerations for Deep Learning in NLP
arxiv.org
2019
VAEベースのリズム生成モデル - Creating Latent Spaces for Modern Music Genre Rhythms Using Minimal Training Data
Nao Tokui
VAEベースのリズム生成モデル - Creating Latent Spaces for Modern Music Genre Rhythms Using Minimal Training Data
2020
パーカッション音の合成 - NEURAL PERCUSSIVE SYNTHESIS 
Nao Tokui
パーカッション音の合成 - NEURAL PERCUSSIVE SYNTHESIS
arxiv.org
2019
監視カメラの画像と画像認識で世界の国々の幸福度を計測? - Measuring Happiness Around the World through AI
Nao Tokui
監視カメラの画像と画像認識で世界の国々の幸福度を計測? - Measuring Happiness Around the World through AI
arxiv.org
2020
WebFace260M - インターネット上で集められた2億6千万枚の顔写真のデータセット
Nao Tokui
WebFace260M - インターネット上で集められた2億6千万枚の顔写真のデータセット
arxiv.org
2021
畳み込みニューラルネットワークの識別能力を用いて抽象画を描く- Perception Engine
Ryo Simon
畳み込みニューラルネットワークの識別能力を用いて抽象画を描く- Perception Engine
Automatic Detection of Cue Points for DJ Mixing
Bogdan Teleaga
Automatic Detection of Cue Points for DJ Mixing
arxiv.org
2020
ドラムパターンとメロディの生成 - Artificial Neural Networks Jamming on the Beat
Nao Tokui
ドラムパターンとメロディの生成 - Artificial Neural Networks Jamming on the Beat
arxiv.org
2021
A Bassline Generation System Based on Sequence-to-Sequence Learning
Nao Tokui
A Bassline Generation System Based on Sequence-to-Sequence Learning
www.nime.org
2019
NSynth: Neural Audio Synthesis—WaveNetを用いたAutoencoderで楽器音を合成
Nao Tokui
NSynth: Neural Audio Synthesis—WaveNetを用いたAutoencoderで楽器音を合成
http://arxiv.org/abs/1704.01279
2017
1万以上のドラム、パーカッション音のデータセット — Freesound One-Shot Percussive Sounds
Nao Tokui
1万以上のドラム、パーカッション音のデータセット — Freesound One-Shot Percussive Sounds
arxiv.org
2020
MuseMorphose: Transformerを用いたVAEによる音楽のスタイル変換
Nao Tokui
MuseMorphose: Transformerを用いたVAEによる音楽のスタイル変換
arxiv.org
2021
見本 - (記事のタイトル)PerformanceRNN - より自然のピアノ演奏の生成
Nao Tokui
見本 - (記事のタイトル)PerformanceRNN - より自然のピアノ演奏の生成
arxiv.org
2017
Generating Long Sequences with Sparse Transformers
Nao Tokui
Generating Long Sequences with Sparse Transformers
arxiv.org
2019
Neural Text Generation with Unlikelihood Training
Nao Tokui
Neural Text Generation with Unlikelihood Training
arxiv.org
2019
The Role of AI Attribution Knowledge in the Evaluation of Artwork
Nao Tokui
The Role of AI Attribution Knowledge in the Evaluation of Artwork
journals.sagepub.com
2021
Talking Drums: Generating drum grooves with neural networks. 
Nao Tokui
Talking Drums: Generating drum grooves with neural networks.
arxiv.org
2017
AAI - AIを用いたMouse on Marsのアルバム
Nao Tokui
AAI - AIを用いたMouse on Marsのアルバム
2021
random_faces - ランダムに存在しない人の顔を生成するPythonライブラリ
Nao Tokui
random_faces - ランダムに存在しない人の顔を生成するPythonライブラリ
arxiv.org
2021
ArtEmis: Affective Language for Visual Art
Nao Tokui
ArtEmis: Affective Language for Visual Art
arxiv.org
2021
UAV-Human: A Large Benchmark for Human Behavior Understanding with Unmanned Aerial Vehicles
Nao Tokui
UAV-Human: A Large Benchmark for Human Behavior Understanding with Unmanned Aerial Vehicles
arxiv.org
2021
Translating Paintings Into Music Using Neural Networks
Nao Tokui
Translating Paintings Into Music Using Neural Networks
arxiv.org
2020
REAL-TIME TIMBRE TRANSFER AND SOUND SYNTHESIS USING DDSP
Nao Tokui
REAL-TIME TIMBRE TRANSFER AND SOUND SYNTHESIS USING DDSP
github.com
2021
WaveNetを使ったAutoencoderで音楽のドメイン間の変換を可能に! – A Universal Music Translation Network
竜空 信末
WaveNetを使ったAutoencoderで音楽のドメイン間の変換を可能に! – A Universal Music Translation Network
arxiv.org
2018
AIを用いたAudio Visual – Stylizing Audio Reactive Visuals
竜空 信末
AIを用いたAudio Visual – Stylizing Audio Reactive Visuals
neurips2019creativity.github.io
2019
観客もDJの演奏に参加?? – Experio: a Design for Novel Audience Participation in Club Settings
Ryo Simon
観客もDJの演奏に参加?? – Experio: a Design for Novel Audience Participation in Club Settings
2014
人工知能でグルーヴを創造する – Learning to Groove with Inverse Sequence Transformations
竜空 信末
人工知能でグルーヴを創造する – Learning to Groove with Inverse Sequence Transformations
arxiv.org
2019
歌詞からメロディを生成 – Conditional LSTM-GAN for Melody Generation from Lyrics
竜空 信末
歌詞からメロディを生成 – Conditional LSTM-GAN for Melody Generation from Lyrics
arxiv.org
ファッションデザイナーを助けるツール – Human and GAN collaboration to create haute couture dress
竜空 信末
ファッションデザイナーを助けるツール – Human and GAN collaboration to create haute couture dress
neurips2019creativity.github.io
2019
SpaceSheets スプレッドシート型UIでの潜在空間探索 – SpaceSheets: Interactive Latent Space Exploration through a Spreadsheet Interface
竜空 信末
SpaceSheets スプレッドシート型UIでの潜在空間探索 – SpaceSheets: Interactive Latent Space Exploration through a Spreadsheet Interface
nips2018creativity.github.io
2018
記号創発問題 ─記号創発ロボティクスによる記号接地問題の本質的解決に向けて─
竜空 信末
記号創発問題 ─記号創発ロボティクスによる記号接地問題の本質的解決に向けて─
jsai.ixsq.nii.ac.jp
2016
ある楽器の音色が別の楽器に!? – TimbreTron: A WaveNet(CycleGAN(CQT(Audio))) Pipeline for Musical Timbre Transfer
竜空 信末
ある楽器の音色が別の楽器に!? – TimbreTron: A WaveNet(CycleGAN(CQT(Audio))) Pipeline for Musical Timbre Transfer
arxiv.org
2018
様々なメディアのフレームを補間する – Depth-Aware Video Frame Interpolation
Ryo Simon
様々なメディアのフレームを補間する – Depth-Aware Video Frame Interpolation
arxiv.org
2020
画像認識モデルが苦手とする画像のデータセット – Natural Adversarial Examples
竜空 信末
画像認識モデルが苦手とする画像のデータセット – Natural Adversarial Examples
arxiv.org
2019
自律的人工アーティストプロジェクト Artist in the Cloud: Towards an Autonomous Artist
高幸 山口
自律的人工アーティストプロジェクト Artist in the Cloud: Towards an Autonomous Artist
2019
機械学習でキュレーションした写真集 – Computed Curation: a photobook created by a computer
高幸 山口
機械学習でキュレーションした写真集 – Computed Curation: a photobook created by a computer
2019
GAN + 人間のデザイナーで椅子をデザイン – The chAIr Project
竜空 信末
GAN + 人間のデザイナーで椅子をデザイン – The chAIr Project
arxiv.org
2018
GAN を使って音楽ジャンルを変換 – Symbolic Music Genre Transfer with CycleGAN
Ryo Simon
GAN を使って音楽ジャンルを変換 – Symbolic Music Genre Transfer with CycleGAN
arxiv.org
2018
音と映像の関係性の学習 – Audio-Visual Scene Analysis with Self-Supervised Multisensory Features
Ryo Simon
音と映像の関係性の学習 – Audio-Visual Scene Analysis with Self-Supervised Multisensory Features
arxiv.org
2018
ビデオカメラの前で一回転→人の3Dモデル – Video Based Reconstruction of 3D People Models
竜空 信末
ビデオカメラの前で一回転→人の3Dモデル – Video Based Reconstruction of 3D People Models
arxiv.org
2018
進化と創造性 – The Surprising Creativity of Digital Evolution: A Collection of Anecdotes from the Evolutionary Computation and Artificial Life Research Communities
竜空 信末
進化と創造性 – The Surprising Creativity of Digital Evolution: A Collection of Anecdotes from the Evolutionary Computation and Artificial Life Research Communities
arxiv.org
2020
DeepDream, Style Transferなどを使ったミュージックビデオ – Hardcore Anal Hydrogen “Jean-Pierre”
竜空 信末
DeepDream, Style Transferなどを使ったミュージックビデオ – Hardcore Anal Hydrogen “Jean-Pierre”
2018
GANによる音の生成 – Synthesizing Audio with Generative Adversarial Networks
Ryo Simon
GANによる音の生成 – Synthesizing Audio with Generative Adversarial Networks
arxiv.org
2018
動画からそれにあった音を生成 – Visual to Sound: Generating Natural Sound for Videos in the Wild
Ryo Simon
動画からそれにあった音を生成 – Visual to Sound: Generating Natural Sound for Videos in the Wild
arxiv.org
2018
ロボットを交えての即興コメディHumanMachine – Artificial Intelligence Improvisation
高幸 山口
ロボットを交えての即興コメディHumanMachine – Artificial Intelligence Improvisation
2017
画像から、好みのメッシュの3Dモデルを作成する -Neural 3D Mesh Renderer-
Ryo Simon
画像から、好みのメッシュの3Dモデルを作成する -Neural 3D Mesh Renderer-
arxiv.org
2017
Deep Learningを用いた音楽生成手法のまとめ – Deep Learning Techniques for Music Generation – A Survey
Ryo Simon
Deep Learningを用いた音楽生成手法のまとめ – Deep Learning Techniques for Music Generation – A Survey
arxiv.org
2017
まるでアルチンボルド? GANを用いて野菜で顔を描く – The Electronic Curator
竜空 信末
まるでアルチンボルド? GANを用いて野菜で顔を描く – The Electronic Curator
2017
AIとの共作で行う「過去との対話」ー Maison book girl 「cotoeri」
Ryo Simon
AIとの共作で行う「過去との対話」ー Maison book girl 「cotoeri」
2017
AIとともに紡ぐホラーストーリー – Sherry, AI-Powered Horror Stories
Ryo Simon
AIとともに紡ぐホラーストーリー – Sherry, AI-Powered Horror Stories
2017
アフリカの野生動物の観測にDeep Learningを利用 – Automatically identifying wild animals in camera-trap images with deep learning
竜空 信末
アフリカの野生動物の観測にDeep Learningを利用 – Automatically identifying wild animals in camera-trap images with deep learning
arxiv.org
2017
人の行動の動画データセット – AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions
Ryo Simon
人の行動の動画データセット – AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions
arxiv.org
2017
”意識の流れを読む”「意識の辞書」 – A Dictionary of Consciousness
Ryo Simon
”意識の流れを読む”「意識の辞書」 – A Dictionary of Consciousness
2017
顔写真から3Dモデルを生成 – Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric CNN Regression
Ryo Simon
顔写真から3Dモデルを生成 – Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric CNN Regression
arxiv.org
2017
Deep Learningを活用した都市の”形態学” – Urban morphology meets deep learning: Exploring urban forms in one million cities, town and villages across the planet
竜空 信末
Deep Learningを活用した都市の”形態学” – Urban morphology meets deep learning: Exploring urban forms in one million cities, town and villages across the planet
arxiv.org
2017
創造性をどう評価するか – A Machine Learning Approach for Evaluating Creative Artifacts
竜空 信末
創造性をどう評価するか – A Machine Learning Approach for Evaluating Creative Artifacts
arxiv.org
2017
音楽の特徴に基づいたダンスの動きのリアルタイム生成 – GrooveNet: Real-Time Music-Driven Dance Movement Generation using Artificial Neural Networks
竜空 信末
音楽の特徴に基づいたダンスの動きのリアルタイム生成 – GrooveNet: Real-Time Music-Driven Dance Movement Generation using Artificial Neural Networks
omid.al
2017
グラフィックデザインにおける各要素の重要性を可視化 – Learning Visual Importance for Graphic Designs and Data Visualizations
竜空 信末
グラフィックデザインにおける各要素の重要性を可視化 – Learning Visual Importance for Graphic Designs and Data Visualizations
2017
衛星写真から住民の所得を推定 – Penny, an AI to predict wealth from space
Ryo Simon
衛星写真から住民の所得を推定 – Penny, an AI to predict wealth from space
2017
衛星写真から住民の所得を推定 – Penny, an AI to predict wealth from space
竜空 信末
衛星写真から住民の所得を推定 – Penny, an AI to predict wealth from space
2017
音楽⇄動画のクロスモーダルな検索技術 – Deep Learning for Content-Based, Cross-Modal Retrieval of Videos and Music
Ryo Simon
音楽⇄動画のクロスモーダルな検索技術 – Deep Learning for Content-Based, Cross-Modal Retrieval of Videos and Music
arxiv.org
2017
料理の写真 ↔︎ 材料とレシピ – Learning Cross-modal Embeddings for Cooking Recipes and Food Images
竜空 信末
料理の写真 ↔︎ 材料とレシピ – Learning Cross-modal Embeddings for Cooking Recipes and Food Images
2017
動植物の画像データセット – The iNaturalist Challenge 2017 Dataset
Ryo Simon
動植物の画像データセット – The iNaturalist Challenge 2017 Dataset
arxiv.org
2017
GANで音楽生成 – MidiNet: A Convolutional Generative Adversarial Network for Symbolic-domain Music Generation using 1D and 2D Conditions
竜空 信末
GANで音楽生成 – MidiNet: A Convolutional Generative Adversarial Network for Symbolic-domain Music Generation using 1D and 2D Conditions
arxiv.org
2017
機械学習による、「演奏」の学習
– Performance RNN: Generating Music with Expressive Timing and Dynamics –
Ryo Simon
機械学習による、「演奏」の学習
– Performance RNN: Generating Music with Expressive Timing and Dynamics –
2017
過去の作品を学習することで本当に新しい作品が作れるのか?? – CAN: Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms
Ryo Simon
過去の作品を学習することで本当に新しい作品が作れるのか?? – CAN: Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms
arxiv.org
2017
人工知能の力を借り、3Dモデルを共作する – Interactive 3D Modeling with a Generative Adversarial Network –
Ryo Simon
人工知能の力を借り、3Dモデルを共作する – Interactive 3D Modeling with a Generative Adversarial Network –
arxiv.org
2017
ウィットに富んだキャプション生成 – Punny Captions: WittyWordplay in Image Descriptions
竜空 信末
ウィットに富んだキャプション生成 – Punny Captions: WittyWordplay in Image Descriptions
arxiv.org
2017
進化の仕組みを応用した音楽ツール – Musical Novelty Search – Evolutionary Algorithms + Ableton Live
Ryo Simon
進化の仕組みを応用した音楽ツール – Musical Novelty Search – Evolutionary Algorithms + Ableton Live
2017
服を着ている人の画像を生成 – A Generative Model of People in Clothing
竜空 信末
服を着ている人の画像を生成 – A Generative Model of People in Clothing
arxiv.org
2017
機械学習を用いたシンセサイザーが持つ可能性 – Making a Neural Synthesizer Instrument –
Ryo Simon
機械学習を用いたシンセサイザーが持つ可能性 – Making a Neural Synthesizer Instrument –
arxiv.org
2017
画像⇆音の生成 – Deep Cross-Modal Audio-Visual GenerationDeep Cross-Modal Audio-Visual Generation
Ryo Simon
画像⇆音の生成 – Deep Cross-Modal Audio-Visual GenerationDeep Cross-Modal Audio-Visual Generation
arxiv.org
2017
連想の学習 – See, Hear, and Read: Deep Aligned Representations
竜空 信末
連想の学習 – See, Hear, and Read: Deep Aligned Representations
arxiv.org
2017
未来を予測して動画を生成 – Generating Videos with Scene Dynamics –
Ryo Simon
未来を予測して動画を生成 – Generating Videos with Scene Dynamics –
arxiv.org
2017
一枚の写真からその後の人の動きを予測 – Forecasting Human Dynamics from Static Images
Ryo Simon
一枚の写真からその後の人の動きを予測 – Forecasting Human Dynamics from Static Images
arxiv.org
2017
AIを言葉でナビして学習 – Beating Atari with Natural Language Guided Reinforcement Learning
竜空 信末
AIを言葉でナビして学習 – Beating Atari with Natural Language Guided Reinforcement Learning
2017
横顔から正面から見た顔を生成 – Beyond Face Rotation: Global and Local Perception GAN for Photorealistic and Identity Preserving Frontal View Synthesis
Ryo Simon
横顔から正面から見た顔を生成 – Beyond Face Rotation: Global and Local Perception GAN for Photorealistic and Identity Preserving Frontal View Synthesis
arxiv.org
2017
絵を「描く」プロセスの模倣 – A Neural Representation of Sketch Drawings
竜空 信末
絵を「描く」プロセスの模倣 – A Neural Representation of Sketch Drawings
arxiv.org
2017
機械学習を用いたドラムマシン – The Infinite Drum Machine : Thousands of everyday sounds, organized using machine learning.
Ryo Simon
機械学習を用いたドラムマシン – The Infinite Drum Machine : Thousands of everyday sounds, organized using machine learning.
2017
目線をあやつる – Gaze Warping
竜空 信末
目線をあやつる – Gaze Warping
2017
見えない体を見る. 一人称視点の映像からカメラをつけている人の姿勢を推定. – Seeing Invisible Poses: Estimating 3D Body Pose from Egocentric Video
Ryo Simon
見えない体を見る. 一人称視点の映像からカメラをつけている人の姿勢を推定. – Seeing Invisible Poses: Estimating 3D Body Pose from Egocentric Video
arxiv.org
2017
Attributesによる画像の美しさ判定 – Photo Aesthetics Ranking Network with Attributes and Content Adaptation
Ryo Simon
Attributesによる画像の美しさ判定 – Photo Aesthetics Ranking Network with Attributes and Content Adaptation
arxiv.org
2017
一枚の写真からヘアスタイル全体が分かる技術 – AutoHair: Fully Automatic Hair Modeling from A Single Image
Ryo Simon
一枚の写真からヘアスタイル全体が分かる技術 – AutoHair: Fully Automatic Hair Modeling from A Single Image
dl.acm.org
2017
CycleGAN 対訳がなくても画像を翻訳(変換) – Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
Ryo Simon
CycleGAN 対訳がなくても画像を翻訳(変換) – Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
arxiv.org
2017
ストリートビューの画像の解析による人口統計調査 – Using Deep Learning and Google Street View to Estimate the Demographic Makeup of the US
Ryo Simon
ストリートビューの画像の解析による人口統計調査 – Using Deep Learning and Google Street View to Estimate the Demographic Makeup of the US
arxiv.org
2017
ファッション・トレンドの解析. 東京は… – Changing Fashion Cultures
Ryo Simon
ファッション・トレンドの解析. 東京は… – Changing Fashion Cultures
arxiv.org
2017
ファッション・トレンドの解析. 東京は… – Changing Fashion Cultures
竜空 信末
ファッション・トレンドの解析. 東京は… – Changing Fashion Cultures
arxiv.org
2017
CNNとLSTMでダンスダンスレボリューションのステップ譜を生成 – Dance Dance Convolution
竜空 信末
CNNとLSTMでダンスダンスレボリューションのステップ譜を生成 – Dance Dance Convolution
arxiv.org
2017
ジョークを集めたデータセット – Collection of over 200,000 short jokes for humour research
Ryo Simon
ジョークを集めたデータセット – Collection of over 200,000 short jokes for humour research
2017
論文からポスターを自動生成 – Learning to Generate Posters of Scientific Papers
Ryo Simon
論文からポスターを自動生成 – Learning to Generate Posters of Scientific Papers
arxiv.org
2017
写真のStyle Transfer- Deep Photo Style Transfer
Ryo Simon
写真のStyle Transfer- Deep Photo Style Transfer
arxiv.org
2017
fMRIの脳の反応を機械学習に利用 ?!? – Using human brain activity to guide machine learning
Ryo Simon
fMRIの脳の反応を機械学習に利用 ?!? – Using human brain activity to guide machine learning
arxiv.org
2017
目が回ります – DeepWarp: Photorealistic Image Resynthesis for Gaze Manipulation
Ryo Simon
目が回ります – DeepWarp: Photorealistic Image Resynthesis for Gaze Manipulation
2017
GANを応用したSANによるSaliency Map(顕著性マップ)の生成 – Supervised Adversarial Networks for Image Saliency Detection –
竜空 信末
GANを応用したSANによるSaliency Map(顕著性マップ)の生成 – Supervised Adversarial Networks for Image Saliency Detection –
arxiv.org
2017
ちょっとしたノイズを加えると…あら不思議 – Adversarial examples in the physical world
竜空 信末
ちょっとしたノイズを加えると…あら不思議 – Adversarial examples in the physical world
arxiv.org
2016
CRNNで鳥の声の識別 – Convolutional Recurrent Neural Networks for Bird Audio Detection
Ryo Simon
CRNNで鳥の声の識別 – Convolutional Recurrent Neural Networks for Bird Audio Detection
arxiv.org
2017
RobotArt – the Robot Art competition
竜空 信末
RobotArt – the Robot Art competition
2017
ファッション写真のデータセット – Large-scale Fashion (DeepFashion) Database
竜空 信末
ファッション写真のデータセット – Large-scale Fashion (DeepFashion) Database
2016
日々のニュース写真から似通った作品を検索(テートギャラリー) – Recognition Tate
竜空 信末
日々のニュース写真から似通った作品を検索(テートギャラリー) – Recognition Tate
2017
ビデオのフレーム補間 – Video Frame Synthesis using Deep Voxel Fl
竜空 信末
ビデオのフレーム補間 – Video Frame Synthesis using Deep Voxel Fl
arxiv.org
2017
音源分離 – Deep Clustering and Conventional Networks for Music Separation: Stronger Together
Ryo Simon
音源分離 – Deep Clustering and Conventional Networks for Music Separation: Stronger Together
arxiv.org
2016
フォントのStyle Transfer? – Awesome Typography: Statistics-Based Text Effects Transfer
竜空 信末
フォントのStyle Transfer? – Awesome Typography: Statistics-Based Text Effects Transfer
arxiv.org
2017
パラレルコーパスデータ集 : OPUS – the open parallel corpus
Ryo Simon
パラレルコーパスデータ集 : OPUS – the open parallel corpus
2017
food2vec – Augmented cooking with machine intelligence
Ryo Simon
food2vec – Augmented cooking with machine intelligence
2017
food2vec – Augmented cooking with machine intelligence
竜空 信末
food2vec – Augmented cooking with machine intelligence
2016
Learning to Draw: Generating Icons and Hieroglyphs
竜空 信末
Learning to Draw: Generating Icons and Hieroglyphs
2017
How many animals can one find in a random image?
竜空 信末
How many animals can one find in a random image?
2017
AENet: Learning Deep Audio Features for Video Analysis
Ryo Simon
AENet: Learning Deep Audio Features for Video Analysis
arxiv.org
2017
T-SNE MAP – Google Arts and Culture Experiments
竜空 信末
T-SNE MAP – Google Arts and Culture Experiments
2016
Learning to Protect Communications with Adversarial Neural Cryptography
竜空 信末
Learning to Protect Communications with Adversarial Neural Cryptography
arxiv.org
2016
Pix2Pixを使った風景画像の生成 – Imaginary landscapes using pix2pix
竜空 信末
Pix2Pixを使った風景画像の生成 – Imaginary landscapes using pix2pix
2016
ドキュメンタリー – The Automation of Creativity: How man & AI will work together to improve the ad industry
竜空 信末
ドキュメンタリー – The Automation of Creativity: How man & AI will work together to improve the ad industry
2016
ドキュメンタリー – The Automation of Creativity: How man & AI will work together to improve the ad industry
Ryo Simon
ドキュメンタリー – The Automation of Creativity: How man & AI will work together to improve the ad industry
2017
クリエイティブ ・チューリングテスト- Turing Tests in the Creative Arts
竜空 信末
クリエイティブ ・チューリングテスト- Turing Tests in the Creative Arts
2016
DeepBach: a Steerable Model for Bach chorales generation by Gaëtan Hadjeres, François Pachet
竜空 信末
DeepBach: a Steerable Model for Bach chorales generation by Gaëtan Hadjeres, François Pachet
arxiv.org
2017
Unsupervised Learning of 3D Structure from Images
Ryo Simon
Unsupervised Learning of 3D Structure from Images
arxiv.org
2016
SoundNet: Learning Sound Representations from Unlabeled Video
竜空 信末
SoundNet: Learning Sound Representations from Unlabeled Video
arxiv.org
2016
MIDIの演奏に強弱をつけてより自然に! – Neural Translation of Musical Style
竜空 信末
MIDIの演奏に強弱をつけてより自然に! – Neural Translation of Musical Style
imanmalik.com
2017
test
竜空 信末
test
変化し続ける架空の人物ポートレート – Portraits of Imaginary People
Ryo Simon
変化し続ける架空の人物ポートレート – Portraits of Imaginary People
Symbolic Music Generation with Diffusion Models
Nao Tokui
Symbolic Music Generation with Diffusion Models
arxiv.org
2021
Introducing Latent Timbre Synthesis
Nao Tokui
Introducing Latent Timbre Synthesis
arxiv.org
2020
Self-Supervised VQ-VAE for One-Shot Music Style Transfer
Nao Tokui
Self-Supervised VQ-VAE for One-Shot Music Style Transfer
arxiv.org
2021
Music transformer: Generating music with long-term structure
Nao Tokui
Music transformer: Generating music with long-term structure
arxiv.org
2018
Novel Recording Studio Features for Music Information Retrieval
Nao Tokui
Novel Recording Studio Features for Music Information Retrieval
arxiv.org
2021
SING: Symbol-to-Instrument Neural Generator
Nao Tokui
SING: Symbol-to-Instrument Neural Generator
Multimodal Neurons in Artificial Neural Networks
Nao Tokui
Multimodal Neurons in Artificial Neural Networks
2021
Audio / Music Dataset
Nao Tokui
Audio / Music Dataset
On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜
Nao Tokui
On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜
2021
AudioViewer: Learning to Visualize Sound
Nao Tokui
AudioViewer: Learning to Visualize Sound
arxiv.org
2020
The Generative Electronic Dance Music Algorithmic System
Nao Tokui
The Generative Electronic Dance Music Algorithmic System
IRMAS Instrument Dataset
Bogdan Teleaga
IRMAS Instrument Dataset
The MTG-Jamendo Dataset
Bogdan Teleaga
The MTG-Jamendo Dataset
2019
音楽関連のオーディオのデータセット
Nao Tokui
音楽関連のオーディオのデータセット
