見出し画像

映画業界における生成AIの活用状況から見る、中長期的な業界の変化

先日OpenAIが発表した動画生成AI「Sora」はテキストから最長1分の動画を生成することができ、従来の類似サービスと比べると精度の高さにも目を見張るものがあります。今後も継続的に性能は向上していくことを考えると、テキストからテレビドラマや映画を生成できる日も近いかもしれません。このText to Videoは技術としてわかりやすいので非常に大きな話題になりましたが、映像、特に映画制作においては既に様々な場面で生成AIが使用されています。ChatGPT登場以前から制作現場へ浸透していたサービスも多く、着々と映画制作の在り方を変えてきています。

本記事では、ChatGPT以前から使われているものも含め映画制作における生成AIサービスの活用状況を俯瞰し、今後起こりうる業界の中長期的な変化についても考察していきます。

なお「識別・予測系AI」も既に映画業界で幅広く使われていますが、本記事では対象外とし、あくまで「制作過程における生成AI」にスコープを絞ることを前書きします。

本記事のスコープ

全体像

個別の事例紹介に入る前に、全体像の整理から始めましょう。映画は、大きく分けて「実写」と「アニメーション」に分類することができます。また、映像制作は「企画や脚本制作を行うプリプロダクション」「撮影やモデリングを行うプロダクション」「生映像をVFX等で加工するポストプロダクション」という3工程にわけることができます。さらに、生成AIの活用方法は大きく分けて「既存の業務を生成AIで効率化する"作業効率化"」と「今まで不可能だった表現や体験を生成AIで実現する"新体験創出"」の二つがあります。
この3つの軸から全体像を見ると、現状最も活用事例が多いのは「実写のポストプロダクションにおける作業効率化」です。次に「アニメーションのプロダクション(モデリング、リギング、モーションキャプチャ等)における作業効率化」となっています。実写ではポスプロの次にプリプロ、プロダクションと続き、アニメーションではプロダクションの次にプリプロとポスプロが同じくらいの活用状況となっています。
後ほども出てきますが、実写・アニメーション共に「新体験創出」はほとんど無いことは非常に重要なポイントです。

映画制作における生成AIの活用状況 - 全体像

この中でも、本日は実写領域に集中してご紹介していきます。アニメーションについては、別途記事を執筆予定です。

ポストプロダクション

ポストプロダクションでは、ChatGPT以前から様々な生成AIツールが現場で活用されています。数が多すぎて全ては紹介しきれないので、その中でも特に有名な作品やスタジオに実際に使用されている事例をご紹介していきます。

音声合成AI - Respeecher

マンダロリアンシーズン2 最終話

マンダロリアンは、Disney+で配信しているスターウォーズシリーズ初となる実写ドラマ作品です。映画シリーズである『ジェダイの帰還』から5年後、『フォースの覚醒』の25年前という舞台設定であるため、世界観が統一されていることはもちろん登場人物も一部被っています。
本作シーズン2の最後に、スターウォーズシリーズ全体のヒーロー的存在であるルーク・スカイウォーカーが登場します。該当シーンで40年以上前のルークの声を再現するために、「Respeecher」という音声合成AIが使われています。同社はDisneyと協力し、若かりし頃のマーク・ハミル演じるルークの声を旧三部作やラジオドラマからAIに学習させ、当時の音声を自由に生成できるようにしました。データの量と質の高さが相まって、公開日から9ヵ月間、音声合成であることは気づかれなかったそうです(Respeecher)。

エイジング処理 - Face Engine

Mac Guff Aging Technology

マンダロリアンでは若い頃の音声を再現するためにAIが使われましたが、こちらの事例では逆に歳を取らせるエイジング処理に生成AIが使用されています。フランスのVFXスタジオであるMac Guff社は、エイジング処理やフェイススワップ(顔の入れ替え)のためにFace EngineというAIツールを内製しました。Netflix OriginalであるLupinやClass Actといった作品で実際に使用されている他、CMや動画広告など映画以外の映像フォーマットでも使われています(Variety)。

CGキャラクター生成 - Wonder Studio

Wonder Studio

Wonder Studioは、実写の役者をCGキャラクターに置き換えるサービスを提供しています。これまでも役者の動きをモーションキャプチャしてCGキャラクターに置き換える手法は広く使われていましたが、役者の手足に多くのセンサーをつける必要がありました。ところがWonder Studioではセンサーを使う必要はなく、通常のカメラで撮影した動画から役者のボーン情報を自動で抽出し、CGキャラクターを重ねることができます。ボーンは後から動かすことができ、カメラワークやライトニングも調整できるため、かなりの自由度をもって調整することができます。タイトルは明らかになっていませんが、Netflix Original作品でも既に使用されているそうです(TechCrunch)。

カメラから被写体のボーンをAIでキャプチャする技術は、23年3月にユニコーン企業になったMove.aiのコアテクノロジーでもあり、ますます注目が高まっている領域です。

リップシンク自動生成 - TrueSync

FALL

FALLは、23年2月に公開されたスリラー映画です。主人公たちは度胸試しのために地上600 mのテレビ塔に登るのですが、降りるための唯一の手段だった梯子が崩落してしまいます。助けを呼ぶこともできない2人は、生き延びる方法を必死に模索するというかなり強烈なストーリーです。追い込まれた主人公たちは自然とR指定用語を叫んでしまうわけですが、商業興行するには過激すぎる言葉を30以上消去する必要がありました。通常であれば該当箇所を丸々カットするか、再撮影する必要があります。ただし、作品構成上重要な箇所であればカットはできませんし、コストや労力を考えると再撮影が現実的でない場面も多くあります。そこで使われたのが、TrueSyncという生成AIサービスです。本サービスは、役者の言葉に合わせて自然な形で唇の動きを自動修正してくれます。TrueSyncの本来のユースケースは、外国語吹き替え作成時に吹き替え後の音声へ役者の唇の動きを合わせることがですが、FALLでは英語で音声を差し替えた後にリップシンクさせるために使用されました。
結果、多数の強烈なR指定用語は違和感なく作品から姿を消し、日本でも興行することができました。数字面でも、制作費300万円に対し興行収入2180万円と、小規模ながら大ヒットを収めた作品となりました(Deadline)。

プリプロダクション

プリプロダクションでも様々な方法で生成AIが使用されています。ただし、ポストプロダクションと違いハリウッドレベルの作品で表立って使用が公言されている事例がないため、紹介できる情報が限定的になっています。例えば、プリプロダクションでは作品の雰囲気や世界観をイメージするためにストーリーボードというものを作成します。これは通常手で描かれることが多いのですが、Midjourney等の生成AIを使用しテキストから画像を生成することによって、より視覚的でわかりやすいストーリーボードを作ることができます。これはプリプロダクションの文脈でよく話題にあがる活用事例ですが、実際にこの方法を採用している作品の情報がないため、今回は詳細な紹介を省きます。

脚本のドラフト生成 - ChatGPT, Dramatron

Dramatron

先日、第170回芥川賞を受賞した「東京都同情塔」の一部に生成AIが使用されていることが話題になりました。本作では、「作中内でAIが生成する文章にChatGPTが生成したテキストをそのまま採用する」という使われ方でしたが、中国でもAIを使って約3時間で執筆された43000字の小説『記憶の国』が文学賞を受賞しています(South China Morning Post)。本noteでも小説執筆AIを紹介しましたが、AIはドラフトレベルであれば物語の骨子を作ることができるようになっています。
映画制作の文脈に置き換えると、作品のストーリーのドラフトを生成AIの助けを借りて作るプロデューサーや脚本家もいるということになります。実際、第1稿をChatGPTに書かせ人間が手直しする脚本執筆フローはハリウッドで実践されており、昨年大きな話題をよんだストライキの一因にもなっていました。ハリウッドは日本と比べプリプロに長い時間とコストをかけることで知られており、脚本家がチームを組み第1稿を何度も書き直して完成度を上げていきます。それでも、第1稿に支払われる報酬額が最も大きいことから生成AIの使用は大きな批判を呼びました(NHK国際ニュースナビ)。日本にも、実験的な作品ではありますが、ChatGPTが脚本を描いた”identita”という映画が存在します。
生成AIツールとして最も使われていたのはおそらくChatGPTですが、実はGoogleのDeepmindも2022年にFoxと共同でDramatronという脚本生成AIツールを開発しています。

ストーリーボード生成 - LTX Studio

LTX Studio

FacetuneやVideoleapといった人気アプリを提供するLightricks社が発表したLTX Studioは、生成AIを使ってショート動画ベースのストーリーボードを自然言語のプロンプトから作ることができます。

LTX Studio

ユーザーがアイデアを入力すると、AIからキャラクター案、脚本、そしてストーリーボードのドラフトが提案されます。ドラフトに対して、プロンプトを書き換えることでシーンやスタイル、天候、場所、キャラクターのセリフ、カメラアングルなど様々な要素を調整することができます。なお、BGMは生成AIではなくプリセットされた音楽が使用されています。

本サービスは現在事前登録受付中ですが、間もなく全ユーザーに無料で提供が開始されるそうです(TechCrunch)。

脚本の要約 - Avail

Avail

映画の脚本を読み議論する作業はプリプロダクションの工程で最も重要な一つですが、全体を読むだけで非常に長い時間がかかります。Availを使うと、入力した脚本が読み込まれあらすじやキャラクター、ジャンルなどの要素に分解されます。更に、Avail上では入力した脚本をベースにした独自チャットボットも利用することができます。役柄に適した俳優のリストを出し合ったり、同ジャンルの類似映画やテレビ番組と比較することができます。将来的には複数者で共同でドキュメントを作成できるようにする機能も追加予定とのこと。Availは『モンテ・クリスト伯』などのパブリックドメインの作品を使用してGPT-4をベースに訓練されています。(TechCrunch)。

プロダクション

実際の映像を撮影するプロダクションですが、近年、屋内スタジオに巨大な高精細ディスプレイを設置し撮影を行う「バーチャルプロダクション(VP)」という手法が勃興してきています。ディスプレイに背景映像を流しその前で役者を撮影することで、わざわざロケ地へ出向かなくてもスタジオ内で撮影が完結します。VPの市場規模は2022年で20億ドル、今後10年間は年率15%ずつ成長すると予測されています(GMI)。
プロダクションにおける生成AIの活用は、このVPにおいて複数事例が出現してきています。

VPの背景画像リアルタイム生成 - Cuebric

Cuebric

Cuebricは、VPの背景画像・映像をAIによってリアルタイム生成できる技術を提供しています。通常のVPでは、ゲームエンジンを使って背景映像を作ることによって、ロケ地に行くよりも遥かに安くかつ早い撮影が可能になりました。また、撮影しながら背景映像の調整も行うことができるので、映像の精度も向上するというメリットがあります。それでもゲームエンジンで精密な背景を作るには一定の時間とコストがかかりますし、撮影しながらの調整もその瞬間に行えるわけではありません。
そこで登場するのが生成AIです。プロンプトで背景画像・映像を生成するため、専門知識は不要ですし文字通りリアルタイムな調整も可能です。Cuebric上で画像編集機能もあり、スタイルの変更やアップスケールなど細かい調整にも対応しています。ハリウッドスタジオの間でも注目が集まっており、既に150回以上デモを行っているそうです(Forbes)。

生成AIがもたらす映画業界の変化

ここまで、映像作品の制作フローにそって生成AIの活用事例・サービスを概観してきました。では、これら生成AIサービスの進化・浸透によって映像制作や映画業界がどのように変わっていくのでしょうか。

まず、比較的イメージしやすいのは「映像制作方法の変化」です。記事冒頭で、生成AIの活用方法には「既存の業務を生成AIで効率化する"作業効率化"」と「今まで不可能だった表現を生成AIで実現する"新体験創出"」の二つがあると書きましたが、映像業界において生成AIが新体験を創出することはないでしょう。マンダロリアンの事例のように作品として部分的な高度化は起こりますが、「スタジオが作った作品をお客さんが見る」という体験の形は変わりません。その分、「作業効率化」観点での影響が大きくなります。
まず、ポストプロダクションの役割が大きくなります。この記事で紹介したポスプロの事例は4つのみですが、これ以外にも様々な生成AIサービスが存在しますし、その活用余地はどんどん高まるでしょう。現状、実写の映画制作においてポスプロは最も予算割当が低い工程ですが、今後はプロダクションの予算の一部を奪っていく形になると予想します(Stephen Follows)。

映画制作における予算割当

次に、作品制作の低コスト化と高品質化が進みます。Wonder StudioやTruesync、脚本生成AI等、ここまで紹介した事例の多くは、コストを抑えながら映像の品質を上げるのに役立つサービスばかりです。もっとも、低コスト化と高品質化は映像制作に限った話ではなく、コンテンツ制作であればほぼ全ての業界に等しく起こる現象といえます。

映像制作の変化

では、このような映像制作の変化は長期的に映画業界へどのような影響を与えるのでしょうか。

ストーリーテリングの重要性が高まる

一つ目に起こるであろう変化は、「商業作品の成功要因としてストーリーテリング(脚本)の重要性が高まる」ということです。

前提として、「映画の興行収入と制作費には正の相関がある」というファクトを抑える必要があります。以下の画像は、2009年における映画の興行収入と制作費をプロットした図です。少し古いデータではありますが、制作費があがれば上がるほど興行収入が高くなっていることがわかります。これは「制作費を掛けるほど豪華なキャストを起用した高品質な映像になる」ということを表しています。

制作費と興行収入の関係

これを所与の前提とした時、映像制作に生成AIが浸透すると何が起こるでしょうかでしょうか。前章で、「生成AIにより低コストでも高品質な作品を作れるようになる」と説明しました。つまり、現在と比べると「制作費に対する映像品質の差が減る」ことになります。

映画の商業成功には様々な変数がありますが、わかりやすさのためにあえて「脚本」「キャスト」「映像品質」「宣伝」の4つに単純化します。制作費が低くてもそれなりの品質を持つ映像を作れるようになるので、「映像品質」の重要性が相対的に低くなるということになります。「宣伝」と「キャスト」は変わらないので、結果的に「脚本」の重要性が高くなるのではないか、と仮説をたてることができます。

ローカルコンテンツの存在感が増す

ストーリーテリングの重要性が増すと、その先に何が起きるのでしょうか。様々な変化が起きる中で、「日本なら日本産コンテンツ、インドならインド産コンテンツ」といったように「ローカルコンテンツ」の存在感が増していくことが予想されます。それに伴い、国内の映画制作市場は更に市場規模が大きくなっていくでしょう。Netflix等グローバルな配信プレイヤーが日本でも人気を誇っている中、少し意外に感じられる変化かもしれません。

こちらについても、説明にあたり前提として一つ事実を抑えておく必要があります。制作技術が十分に発達しており国内だけでそれなりの品質の映像を作れる国では、英語圏を除き「ローカルコンテンツがヒット作の多くを占める」ということです。例えば、ボリウッドを擁するインドではNetflixの映画Top10ランキングのうち8本が国産映画です(24年1月8-14日のデータ)。日本でも、21~23年における興行収入(単年毎に集計)ランキングTop20のうち15本が国産映画です。これだけコンテンツがグローバル化している現代において少し意外な事実かもしれませんが、結局「自国の文脈に合っており価値観を理解しやすい作品の方が広く好まれる傾向にある」ということを表しています。少なくても、日本で韓国ドラマが流行しているように、文化や価値観が似通っている地域単位で人気作が集中していることがほとんどです。

生成AIが普及しストーリーテリングの重要性が増すと、脚本制作に割り振られる予算が増えます。プロデューサーや脚本家は、縁もゆかりもない土地に関する物語ではなく、自国や周辺地域に根差した物語をより精度高く作るようになるでしょう。そうした作品は、国外ではなく国内を中心にヒットする可能性が高まります。つまり、「国内におけるローカルコンテンツの存在感が増す」という仮説を立てることができます。

実際、Netflixのアジア地域コンテンツ統括であるキム・ミヒョン氏も「自国でのヒットこそが成功」「グローバルな視聴者のためのグローバルな番組は存在しない」と述べています(Business Insider)。

企業が検討すべき論点

ここまで二つの大きな変化について説明しましたが、最後にその変化に対して企業が検討すべき論点についても触れて本記事を結びたいと思います。

「高品質な作品が増加し、ストーリーテリングの重要性が増す」という変化に対しては、当然「生成AIを使いこなし映像品質の向上を追求する」ことが必要です。逆に言うと、生成AIを使いこなせないと他社が当たり前に出せている品質に追いつくことができず、差を開けられてしまいます。次に、「Howではなく“What”を語れるクリエイターを発掘・育成」することが重要になります。生成AIの助けを借りることで、制作技術に対する差別化が減ります。その分、What(何を伝えるか)を精度高く作れるクリエイターが重要になるでしょう。

「ローカルコンテンツの存在感が増す」という変化に対しては、海外進出の戦略として「日本コンテンツの輸出ではなく海外スタジオとの共創による海外進出」ことを基本に検討すべきでしょう。長期的に見ると、人口減少に伴い国内マーケットは頭打ちしてしまうので、持続的に成長するには海外進出が必須です。しかし、海外ではその国・地域のコンテンツが強くなり、日本コンテンツで勝負できる余地がどんどん減っていきます。そのため、日本コンテンツの輸出ではなく海外スタジオと共創し、ローカルコンテンツを一緒に作る戦略の方が有効になります。そうすると、当然「海外スタジオと共創できるクリエイターを発掘・育成」できることが重要になってきます。これは、外国語を話せるというハード面での適性だけでなく、働き方やコミュニケーションスタイルなどソフト面も含めて海外との共創に対応できる人材が求められるということになります。

企業が検討すべき主要論点

Liquid Studioについて

Liquid Studioは、メディアエンタメ業界に特化した併走型コンサルティングスタジオです。生成AIなどの先端テクノロジーに強みを持ち、ビジネスと技術の両面からハンズオンでご支援致します。これまで、大手新聞社やデジタルニュースメディア、エンタメ系スタートアップ、雑誌社など多数の企業様に対し、社内セミナーや技術導入、戦略提案、オペレーション構築など多角的な支援を提供してきました。
HP: https://www.liquidstudio.biz/

この記事が気に入ったらサポートをしてみませんか?