Entry

FakeAVCeleb - ィープフェイク技術で作った顔と話し声のデータセット

Simple Title

FakeAVCeleb: A Novel Audio-Video Multimodal Deepfake Dataset, Hasam Khalid, Shahroz Tariq, Minha Kim, Simon S. Woo (2021)

Description

顔をディープフェイク技術で動かし、リップシンクした音声を追加することで作ったDeepfake動画のデータセット。ディープフェイクへの対抗策の研究が目的。

Type

Dataset

Year

2021

Posted at

September 8, 2021

Overview

ディープフェイク技術を使ったフェイクニュースなどが社会問題になる中で、その認識技術の開発のためのデータセットが公開。
今までもこうしたデータセットは存在したが、これまでは動画か音声のどちらかだけだった。このデータセットでは、合成した動画、音声をリップシンク技術で結びつけることで、音声付きの動画を大量に作った。

Data

フェイク動画を作るプロセス

既存のディープフェイク動画識別モデルをこのデータセットや他のデータセットにかけて、その精度を計測。このデータセット(FakeAVCeleb 右端)のデータは識別が比較的難しいことがわかる。

既存の識別モデルの性能