[Dataset]
2021
顔をディープフェイク技術で動かし、リップシンクした音声を追加することで作ったDeepfake動画のデータセット。ディープフェイクへの対抗策の研究が目的。
FakeAVCeleb: A Novel Audio-Video Multimodal Deepfake Dataset, Hasam Khalid, Shahroz Tariq, Minha Kim, Simon S. Woo (2021)

2021
なんと総時間は約126年分!! データセットを生成するためにpytorch上に実装された、GPUに最適化されたモジュラーシンセ torchsynthも合わせて公開。
Turian, J., Shier, J., Tzanetakis, G., McNally, K., & Henry, M. (2021). One Billion Audio Sounds from GPU-enabled Modular Synthesis.

2021
バイアスやプライバシーへの配慮から、人を対象にしたデータセットを集めることが難しくなっている。そこでGANなどを使って、適切なデータセットを人工的に作り出す仕組みを提供するスタートアップが登場した。
-

2021
400万人の人の2億6000万枚の顔写真のデータセットと、ゴミデータを取り除いた200万人/4200万枚の顔写真のデータセットの二種類を提供
Zhu, Z., Huang, G., Deng, J., Ye, Y., Huang, J., Chen, X., … Zhou, J. (2021). WebFace260M: A Benchmark Unveiling the Power of Million-Scale Deep Face Recognition

2020
ドラム、パーカションのワンショットを集めたデータセット
António Ramires, Pritish Chandna, Xavier Favory, Emilia Gómez, & Xavier Serra. (2020). Freesound One-Shot Percussive Sounds (Version 1.0) [Data set]. Zenodo. http://doi.org/10.5281/zenodo.3665275

2021
ドローンから撮影した人の行動の動画のデータセット。ドローンを使った監視に直結する恐れ??
UAV-Human: A Large Benchmark for Human Behavior Understanding with Unmanned Aerial Vehicles

2021
8万枚の絵画にクラウドソーシングで44万の言語情報を付加。
ArtEmis: Affective Language for Visual Art

2019
Dan Hendrycks, Kevin Zhao, Steven Basart, Jacob Stein- hardt, and Dawn Song. Natural adversarial examples. arXiv preprint arXiv:1907.07174, 2019.

2017
AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions

2017
The iNaturalist Challenge 2017 Dataset

2017
Mapillary Vistas Dataset

2017
いろいろなGANまとめ

2017
AudioSet

2017
Collection of over 200,000 short jokes for humour research

2016
ファッション写真のデータセット – Large-scale Fashion (DeepFashion) Database

2017
OPUS – the open parallel corpus

2016
The Lakh MIDI Dataset v0.1
