見出し画像

オスカーベイト(*)は実在するのか?DatabricksとIMDbのデータで検証してみた -- Is Oscar Bait Real? We Used Databricks and IMDb Data to Find Out

こちらの翻訳です。2022.3.28
(*) オスカーベイト(Oscor Bait)とはアカデミー賞を狙った映画のこと。

100年にわたるホラー映画の分析でお分かりにならなかったかもしれませんが、Databricksは本当に映画が大好きなんです。また、データに夢中になっています。そこで、第94回アカデミー賞を目前に控え(注;翻訳は発表後でに行ってます)、この2つを再び結合させる絶好の機会だと考えたのです。そこで私たちが選んだトピックは オスカー・ベイト(Oscar Bait)。それは、一見するとオスカーにノミネートされるように設計された映画を指す言葉です。

もっと具体的に言うと、「Oscar Bait(オスカー・ベイト)」は実在するのでしょうか?

このブログでは、Delta Live Tables(DLT)とDatabricks SQLを使用して、映画、テレビ番組、セレブに関する、世界で最も人気があり信頼できる情報源であるIMDb(訳者注;米国の映画データベース)の豊富なデータセットを処理・分析し、この疑問に答える私たちのアプローチを紹介したいと思います。この使用例では、興味深い発見があっただけでなく、DLTの宣言型アプローチにより、信頼性の高いデータパイプラインの管理に必要な作業とコードが劇的に削減されることが実証されています。

Oscar Baitとは?

Oscar Baitオスカー・ベイト)とは、アカデミー賞のノミネートを狙って作られたような映画のことを指します。何が「Oscar Bait」を構成するかについての公式な定義はありませんが、一般的に合意されたテーマと特徴のリストがあります。

  • 歴史・時代劇または悲劇のサブジャンルであること。

  • 上映時間が長い

  • 1年のうち最後の数ヶ月である「オスカーシーズン」に公開される

これらの特性は、多少の解釈が必要になりますが、映画がオスカーベイトであるかどうか、そして最終的には、これらが本当にアカデミー賞のノミネートや受賞と相関しているかどうか、を判断するために使用する属性の基礎となりました。

データおよび基準

分析には、1980年から2019年までのアカデミー賞ノミネート作品と受賞作品のIMDbのライセンスデータセットを使用しました。私たちは、同じ現代の文脈で映画を比較するためにこの時間枠を選択しました。例えば、1929年の映画の上映時間のような特性を2019年の映画と比較しても、それは適切でないのです。2020年と2021年は、パンデミックを考慮し、アカデミー賞としては異常な年と判断し、私たちが2019年で分析を打ち切ったことに注意してください。
次のステップは、オスカーベイトを構成するデータセットの属性を定義することでした。私たちは以下を特定しました。

  • 映画の長さ。> 90分以上

  • 公開月 10月、11月、12月

  • オスカーベイトのサブジャンルに属する(下記参照)

  • アニメーションやドキュメンタリー映画でないこと

IMDbのデータセットには、非常に広範なものから非常に特殊なものまで、膨大な量のサブジャンルラベルが含まれています。範囲を狭めるために、分析のために、"時代"、"歴史"、"悲劇"、"メロドラマ"、"ドキュメンタリー"、"叙事詩"などの関連キーワードを特定しました。そして、Oscar Bait の基準に最も合致する、最も一般的な 20 のサブジャンルを選択しました。"アニメーション"や"ファンタジー"を含むサブジャンルは、「Oscar Bait」とはみなされませんが、"叙事詩"のようなものはBaitサブジャンルに含まれることがあります。

データパイプラインの構築

昨年、データ処理パイプラインの構築と管理を容易にするフレームワーク「Delta Live Tables」の発売を発表しました。

DLTは、宣言型のパイプライン開発、データ品質の問題を防ぐための自動データテスト、モニタリングとリカバリのための深い可視性によって、データエンジニアリングチームがETLの開発と管理を簡素化できるよう支援します。この宣言的アプローチは、データエンジニアが何をしたいかを DLT に伝えるだけで、あとは DLT が処理することを意味します。ユースケースは、ほんの数行のコードで実行することができます。

以下は、このユースケースのコードの一部です。

次に、Databrick SQL(DB SQL)を使用して可視化を構築しました。DB SQLはパフォーマンスを最適化し、アナリストが簡単にダッシュボードを作成できるようにするもので、すべてLakehouseプラットフォームで統一されています。Databricks SQLとその利点については、以前のブログで詳しくご紹介しています。

私たちの分析

複数のダッシュボードを組み合わせて、Oscarのトレンドを洞察しました。表面的なトレンドに焦点を当てた分析ではありますが、いくつかの興味深い洞察を発見することができました。

上のグラフは、アカデミー賞のノミネート作品(上)と受賞作品(下)のうち、Oscar Baitの基準をすべて満たした作品の割合を示しています。明白なことを言うと、オスカー・ベイトは数十年にわたり一貫して映画のわずかな割合を占めています。アカデミー賞の受賞作品を見ると、この話はより面白くなり、2010年代のオスカーベイトは140%以上の増加があります。どうしてこんなことが起きているのでしょうか?

次のセクションで説明するように、これを推進しているのは、より長いランタイム、年末の映画リリース、ドキュメンタリー、より負の要素がある、複雑な映画の人気の増加など、一般的な映画の傾向のシフトであると思われます。

我々の仮説

例外はありますが、アカデミー賞は一般的に大衆に支持された作品を表彰します。このIMDbのリストでは、1980年から2019年まで、作品賞受賞作品の100%が観客スコア7.0以上であることまで示されています。しかし、他の消費財と同じように、映画にも流行り廃りがあります。

例えば、90年代と2000年代前半はロマンティックコメディの「黄金時代」と言われています。しかし、スタジオはロマンティックコメディの生産を大幅に減らします。例外はあるものの、一般的に若い、世界の観客には響かないからです。今日の幅広い観客にアプローチするために、このジャンルはロマコメ・ドラマに取って代わられ、『世界に1つのプレイブック』、『アーティスト』、『世界で1つの彼女』(いずれもオスカーにノミネート)に見られるように、深刻なテーマや社会批判に触れるようになったのです。

鶏が先か卵が先かといったところだが、現代の世界の観客は一般的に、より負の要素の強い、複雑な映画を好むようだ。その多くは、標準的な「エサ」の型にはまったものである。

より深く掘り下げると

次に、3つの属性(上映時間、サブジャンル、公開日)を個別に分析しました。これらは、より幅広い作品群から洞察を得るために、すべてのアカデミー賞ノミネートを分析します。

洞察1;上映時間の増加

まず、最初に見た特徴は、上映時間です。グラフが示すように、ほとんどの映画は、数十年にわたって90分〜2.5時間です。しかし、アカデミー賞候補作品は1990年代に長くなり、2000年代には2.5〜3時間の映画で45%近く増加しました。興味深いことに、1997年に公開されたタイタニックは3時間14分で、現代のアカデミー賞の記録を破り、画期的な11の賞を獲得しました。「タイタニック」のような長編ドラマを作ろうとする動きが出てきたのでしょう。

2000年代には、『アバター』や『ロード・オブ・ザ・リング』『ホビット』『ハリー・ポッター』シリーズなど、コンピュータグラフィックスの進化に後押しされたファンタジー大作が急増しています。これらの映画は通常、非常に長い上映時間となり、その多くがアカデミー賞にノミネートされ、受賞しています。

洞察2;アカデミー賞シーズンが実在

「オスカー・シーズン」とは、オスカーに値する映画が年末に公開され、ノミネートの時期に最も注目されるという概念で、誰もが口にします。上のグラフは、年末は常にオスカーにノミネートされた映画のリリースが最も活発であることを示していますが、2010年代には大幅に増加しました。

この変化は、2000年代半ばにストリーミングサービスが台頭し、すでに入場者数の減少に直面していた映画館に新たな競争をもたらしたこととも 関係しています。また、年末は祝日休みなどにより、映画館にとっては収益を上げる機会となっています。12月24日から1月1日は、2019年の年間総興行収入の5%近くも占めています。ストリーミングサービスの圧力も加わり、収益を上げようとする映画が、消費者にとって最適な映画鑑賞の時期に発売されるのは理にかなっており、それはオスカーシーズンとも一致しています。

洞察3;ドキュメンタリードラマの台頭

最後に、サブジャンルの変遷を見てみましょう。上のグラフは、アカデミー賞にノミネートされた作品のうち、「Oscor Bait」のサブジャンルに該当するものだけを示しています。
ご覧のように、過去10年間で、歴史映画やドキュメンタリードラマ(ドクドラマ)のサブジャンルの映画が著しく増加しています。その一方で、時代劇は減少しています。
過去10年間のアカデミー賞候補作を見ると、多くの「歴史」映画は「衣装や時代劇」に重点を置かず、現代の観客に直接関連する歴史的な瞬間にスポットを当てています。『ソーシャル・ネットワーク』(2010年)は、ソーシャルメディアが私たちの生活に不可欠な存在になりつつあるときに公開されました。『イミテーション・ゲーム』は、古いテーマを扱っていますが、現在のテクノロジーの隆盛を物語っています。アカデミー賞受賞作の『ウルフ・オブ・ウォールストリート』や『マネーショート』は、近年の経済不況と米国の富に関する議論に触れています。

また、この10年間はコンピュータフラフィックスがより進化し、歴史的なテーマをよりリアルに、あるいは複雑に取り上げる機会が生まれた時期でもあります。例えば、『アイリッシュマン』(老化防止技術を使用)、『1917 命をかけた伝令』、『ファースト・マン』などの映画は、「Oscor Bait」のサブジャンルに属し、いずれも特殊効果でアカデミー賞にノミネートされた。

まとめ

では、Oscar Baitは実在するのだろうか?

私たちの研究は、マーケティングの影響や、ノミネートと受賞映画を決定するアカデミー会員の代表などのパターンを考慮していませんが、アカデミー賞によって認められた多くの映画が「Oscar Bait」トロフィーには当てはまらないことを示唆しています。多くの場合、特定の映画をそのようにラベル付けすることは、過度に単純化され、より広い映画の傾向を無視します。私たちは、第94回アカデミー賞がこの話をどう進化させるかに興味があります。

あなた自身で同様の分析を試してみることに興味があれば、プライベートプレビューをリクエストして、デルタライブテーブルをご利用いただけます。

IMDbの詳細

800万の映画、テレビ、エンターテインメントのタイトル、1,100万人のキャストとクルー、1,200万の画像など、数億の検索可能なデータ項目を持つIMDbは、映画、テレビ番組、セレブに関する情報源として世界で最も人気があり権威があり、ウェブとモバイルを合わせて毎月2億人以上が訪れています。
IMDbは、あらゆる映画、テレビシリーズ、ビデオゲームのキャストとスタッフのリスト、Box Office Mojoによる生涯興行収入、IMDbの世界中の2億人を超えるファンによる独自の映画とテレビのユーザー評価など、世界中のファンや専門家に力を与え、エンターテイメント体験を向上させています。
IMDbは、その膨大で権威あるデータベースからの情報を、映画スタジオ、テレビネットワーク、ストリーミングサービス、ケーブル会社、さらには航空会社、電機メーカー、非営利団体、ソフトウェア開発会社などのサードパーティ企業にライセンス供与しています。詳しくはdeveloper.imdb.comをご覧ください。


この記事が気に入ったらサポートをしてみませんか?