見出し画像

ディープフェイクの現状と未来

ディープフェイク(Deepfake)とは、ディープフェイク技術を利用して作成された合成メディア(通常、動画)のことです。実在の人物の画像や動画、音声を操作することによって、その人が実際に行っていない行為を行ったり、実際口に出していないことを発言したりしているように描くことができます。機械学習モデルに対象人物の画像を数千件与えれば、ディープフェイクアルゴリズムはその人の顔の詳細を学習できます。そして、十分な量の教師データがあれば、アルゴリズムは、別の人の表情を真似すると対象人物の顔はどのように見えるかを予測できるようになります。ディープフェイクアルゴリズムに誰かの声のアクセントやイントネーション、トーンの模倣を学習させる際も同様のプロセスが用いられます。

ニュース解説メディアVoxは6月下旬、ディープフェイク技術がドキュメンタリーの制作に利用されたことを報じました。ドキュメンタリー『チェチェンへようこそ』は、チェチェンでのゲイやレズビアンに対する迫害、違法な勾留、拷問を取り上げています。制作者は、ディープフェイク技術を利用することによって、出演者のアイデンティティを保護しながら撮影することができたのです。

また、Wiredは最近、新型コロナウィルス感染症拡大を受けたロックダウンにより動画撮影が困難になっており、地域によっては危険を伴う場合もあることを報じています。このようなことから、企業が説明動画や宣伝用資料などを撮影することが難しくなっています。その回避策として、一部の企業は、ディープフェイク技術を利用して、社員向けの研修動画を作成することを検討しています。

同様に、Rosebud AIはディープフェイク技術を利用して、本物のように見える人物の写真を生成するツールを開発しました。最近では、衣装の写真を用いて、この人物に着せた画像を作成するサービスを開始しています。

さらに、ディズニーがメガピクセルの大画面の画質を向上させるため、ディープフェイク技術に取り組んでいることも明らかにされています。この技術は、登場人物を若い年齢で描く必要がある場合や、俳優が既に死亡しているなどで本人が登場できない場合に用いられます。出来上がった映像は完璧とは言えませんが、ディズニーのモデルの品質は際立っています。ご参考までに付け加えると、現在のディープフェイク動画は256x256ピクセルで画質が最高になりますが、ディズニーのモデルは最大1024 x 1024ピクセルまで高品質の動画を作成することができます。

ディープフェイクに対する反応

2020年初め、Facebookが操作された動画や画像の投稿を禁止したことを皮切りに、ディープフェイク技術に対する反応に明らかな変化が見られるようになりました。Facebookは誤解を招くようなAI編集コンテンツを削除すると発表しましたが、パロディや風刺は禁止しないと付け加えています。そのため、議員たちは、Facebookの対応が、偽情報の拡散という根本的な問題に対処する上で十分とは言えないのではないかと考えています。

また、Ars Technicaによるこちらの記事に示されているとおり、ディープフェイクの作成やデプロイはすぐ簡単に行えるので、近い将来悪用されることが危惧されています。米国では大統領選挙が近づいているのでなおさら、軍事指導者を始めとして多くの人が懸念を表明しています。ディープフェイク技術が改良され、より利用しやすくなっていることは、この懸念を強める結果になっています。

ディープフェイクの検出と規制をめぐる一連の動きに関する最新情報としては次のようなニュースが挙げられますが、ディープフェイクに実際どのように対処すべきかについては議論が続けられています。Twitterは昨年11月、ディープフェイクに関するポリシーを策定する意向であることを発表しました。Facebookは、3,426人の俳優と様々な既存の顔入れ替え技術を用いて制作された10万件以上のクリップを含む、知られている限り最大のディープフェイクデータセットをリリースしました。Googleもまた、ディープフェイク検出技術の改良に貢献するため、ディープフェイクデータセットを提供しています。

ディープフェイク検出技術の改良

ディープフェイク技術の悪用をめぐる懸念に伴い、ディープフェイクの検出技術も改良されています。Microsoft研究所と北京大学のチームは最近、顔画像が偽造かどうかを検出するツールであるFace X-Rayを提案しました。このツールは、一つの画像が別の画像と合成された痕跡を探し出し、偽造を検出します。研究は望ましい方向に進んでいるとはいえ、研究者たちは、このテクノロジーが完全な合成画像を検出することはできないと述べています。そのため、この技術は敵対的なサンプルに対しては脆弱になるでしょう。

昨年12月、FacebookはMicrosoftやAmazonなどの巨大IT企業と共同で、ディープフェイク検出チャレンジの開催を発表しました。これは、操作されたメディアを検出するテクノロジーの構築に金銭的な報酬を提供するものです。Facebookは6月、2,114人の参加者が提出した35,000個以上の検出アルゴリズムの中から選ばれた最優秀モデルを発表しました。この最優秀アルゴリズムの精度が平均65.18パーセントであることからも、検出技術は改善されているとはいえ、まだ困難な課題であることがわかります。

検出技術が進歩する一方、多くの研究者たちは、視聴者の教育が最大の防御策であると指摘します。研究者は、動画コンテンツを視聴する際、次の事項に注意することを勧めています。
・突飛な動画や、普段と異なる動画ではないか。
・画質が低かったり、粒子が粗かったりしないか?
・動画の長さ(現在のディープフェイクは通常、30秒から60秒程度の長さです。)
・コンテンツの映像や音声 (顔がぼやけていたり、照明がおかしかったり、音声と口の動きが合っていなかったりなど)

このように、ディープフェイクをめぐる懸念が高まっているにもかかわらず、ディープフェイクのソーシャルメディアへの進出がおさまりません。実際、ソーシャルメディアプラットフォームにおける最近の技術開発では、ディープフェイクの実用化が話題に上るようになっています。モバイルアプリDouyin(ドウイン)とTikTokの内部コードには、ユーザーが他の人の動画に自分の顔を挿入できる機能があることが明らかになりました。このアプリはまだリリースされていませんが、ディープフェイク技術を活用したソーシャルメディアプラットフォームの代表例です。また、Snapchatアプリの開発元のSnapも、画像と動画の認識技術を手がけるスタートアップであるAI Factoryを買収したことが報じられています。Snapが新しい顔入れ替え技術にAI Factoryの技術を利用しているという報道を受け、ディープフェイクの利用が広がることに対する懸念の声が生じています。とはいえ、これらディープフェイク技術の実用化は、ソーシャルメディアアプリが新たなユーザーを惹きつけるための手段として継続される可能性が高いでしょう。

さいごに

上記のニュース記事は、ディープフェイク技術がなくなることはないという明確なトレンドを示しています。今後、ディープフェイクは無害で斬新なものから潜在的に破壊的かつ有害なものまで、様々な形で使用されていくでしょう。開発と検出がお互い競争しながら進歩するなか、検出手法の改良がディープフェイク技術の進歩に追いつくのに苦労しています。その結果、通常の消費者にとって、本物のニュースとフェイクニュースを見分けることはますます困難になるでしょう。そこで、消費者をどこからどのように教育するかがより重要な意味を持ちます。

そう考えると、TwitterやFacebookなどのIT企業がディープフェイク技術をどのように規制するかは、人々がディープフェイク技術をどのように消費し理解するかに大きな影響を与えることになります。 2020年には、規制をめぐる議論が高まり、エンターテインメントやソーシャルメディア分野での開発がより進むと予想されます。そして、これらに伴って、ディープフェイクの実装および検出技術が進歩していくことになるでしょう。ディープフェイク技術の潜在的な脅威とその対策に関しては、こちらの記事をご覧ください。

Lionbridgeチームは、ディープフェイクが今後も機械学習のトレンドの一つとして、ニュースで引き続き取り上げられるだろうと予想しています。AI技術の最新情報活用事例に関する記事を直接受信できるよう、ぜひニュースレターにご登録ください。

※ 本記事は、弊社英語ブログに掲載された記事に基づいたものです。

この記事が気に入ったらサポートをしてみませんか?