AI企業としてのネットフリックス：パーソナライゼーションとコンテンツ生成

2024年1月22日 12:15

　ネットフリックスは、世界最大級のエンターテイメントサービス企業であると共に、テクノロジー業界をリードするAIの先駆者として古くから広く認知されている企業です。またネットフリックスは、コンテンツ配信インフラの技術からデータ分析技術に至るまで、幅広い技術開発を自社でも行い、オープンソースソフトウェアコミュニティに対しても多大な貢献を行っている企業です。　

　技術スタックの視点からネットフリックスのビジネス基盤を見ると、コンテンツ配信、推奨システム、そしてコンテンツ制作という機能に支えられていますが、これらの全ての領域で、高度なAI技術が積極的に活用されています。ここでは、ネットフリックスでのAI活用事例にスポットを当て、ネットフリックスの中でどのようにAIが利用されているかを紹介します。　

1. ネットフリックスのAI活用について

　ネットフリックスにおけるAIの活用は、エンターテイメント業界の在り方に大きな変化をもたらしました。彼らは、視聴体験の新基準を設けることで、世界中のユーザーの支持を得てグローバル規模で成功を収めています。　
　ここでは、ネットフリックスがAIを活用している主要なシーンを大まかに概観してみます。

　イメージしやすいよう便宜的に2つの領域に分けてみました。
視聴者のコンテンツ体験に直接関わる「視聴者のコンテンツ体験領域」とコンテンツが視聴者に届く前にAIを活用する「バックオフィス領域」の2つです。　

（1）視聴者のコンテンツ体験領域

（2）バックオフィスの領域

　上記のAI活用例について少し補足します。
　まず、視聴者のコンテンツ体験領域におけるAI活用の代表例がパーソナライズされたコンテンツ推奨です。今ではネット系サービス企業では、あたりまえのこの機能ですが、ネットフリックスは古くからこの分野をリードし、視聴者ごとにカスタマイズされた推奨を提供することでその知名度を広めて来ました。
　パーソナライズされたレコメンデーションといえば、アマゾンも有名で、購入履歴や検索クエリに基づいた優れた商品提案をすることで知られています。ネットフリックスの場合は、過去の視聴履歴、視聴中のコンテンツ、好みのジャンル、視聴者の評価、視聴環境、視聴時間などの様々な要素を考慮し、個々の視聴者に最適なコンテンツを提案します。共同創業者であり、元CEOのリード・ヘイスティングス氏は2016年に、視聴者の観るコンテンツの75％以上がネットフリックスが推奨したコンテンツであると述べており、更に2020年にはその数値が80％に上昇しています。
　このように、ネットフリックスのコンテンツ推奨機能は、視聴者の嗜好の変化にも柔軟に対応し、視聴者の関心事に合わせたコンテンツを提供することで、視聴者のエンゲージメントを継続的に高めており、その優れたパーソナライゼーションテクニックはテクノロジー業界でも高く評価されています。
また続いてのバックオフィス領域では、主にコンテンツの企画や制作におけるAIの活用がコアとなっています。様々なデータに基づいて視聴者の好みを的確に把握し、視聴者に魅力あるコンテンツを企画・制作・プロモーションするというビジネスモデルは、数々のヒット作を生み出して視聴者を惹きつけてきた秘訣となっています。　

2. 生成AIへの取組みについて

　近年、大規模言語モデルや拡散モデルといった技術に支えられる生成AIが注目を集めて一大ブームとなっていますが、ネットフリックス内での研究開発や実用化も進んでいると考えられますし、一部、トランスフォーマーによる自然言語処理による視聴者のコメント分析のような事例の公開もなされています。
　ネットフリックスにとっての生成AIは、自身のビジネスを強化・拡大するための契機をもたらす一方で、競合他社が生成AIを利用してネットフリックスの脅威になる可能性があるという2面性があります。実際、生成AIの活用は、脚本、ストーリー、特殊効果、サウンドデザイン、予告編、マーケティング資料などなど、幅広い分野で期待されており、徐々に利活用の裾野が拡がって来ている状況にあります。　
　そのような状況の中、生成AIに係わるネットフリックスが直接発信する情報は極めて限られており、ネットフリックスの生成AIの具体的な取り組みをここで詳細に説明することは難しい状況です。　

　いずれにせよ、2023年7月には、ネットフリックスのAI投資に対する強気姿勢が業界を驚かせたりもしています。これは、機械学習プラットフォームのプロダクトマネージャー職に対し、年俸90万ドル（約1億3,000万円）という高額報酬を提示したというものです。既に現在、このポジションの公募はなくなっているようですが、その他のAIソフトウェアエンジニアやゲームの技術ディレクターなどのポジションについては今もなお、最高70万ドル（約1億円）の高額年俸で人材を募集しています。興味のある方は、ネットフリックスの求人サイトをチェックされてみたらいかがでしょうか？

3. AI活用目的と活用例

　ネットフリックスにおけるAI活用の目的を（1）視聴者個人を知る、（2）コンテンツの選定と推奨、（3）最適なコンテンツ体験を実現、（4）視聴者にアピールするコンテンツの制作、（5）コンテンツ制作の意思決定、の5つに分けて、AI活用例を紹介していきます。

（1）視聴者個人を知る

　ネットフリックスは、毎日何百万人もの視聴者から収集される膨大なデータを分析し、高度なアルゴリズムを用いて、視聴者一人ひとりの好みや行動パターンを深く理解し、人間が把握しにくい微妙な嗜好や行動パターンまでを捉えて、視聴者の好みに沿ったコンテンツを推奨します。そして、視聴者がコンテンツを楽しめば楽しむほど、AIは視聴者の好みをより精密に理解し、更により良いコンテンツ提案ができるようになります。

（2）コンテンツの選定と推奨

　コンテンツ選定と推奨のプロセスは、視聴者のプロファイルに基づいて視聴されるであろうコンテンツをジャンル、テーマ、ストーリーライン等の要素から選び出して、配信システムを通じて視聴者に提案する工程です。
　ネットフリックスが保有するタイトルは、16,800タイトルを超えるといわれ、これら大量のコンテンツライブラリから、視聴者の個人に適切なタイトルを適切に選定するのは、なかなかに困難なことです。

　ネットフリックスは、映画や番組を細分化して分類するために“altgenres”という独自のタグライブラリを持っています。“altgenres”の76,000以上のユニークなタグを使うことで、コンテンツを詳細に分類することができます。例えば、単なる「コメディ」というジャンル分けではなく、「ダークコメディ」や「ロマンティックコメディ」のようなサブジャンルにまで細分化することができ、これによって視聴者一人ひとりのわずかな嗜好の違いに対し、適切なコンテンツ提案ができるようになります。
　更に、"altgenres"のタグは、コンテンツのテーマ、ムード、キャラクターの特性、感情表現などを細かく表現することができ、AIアルゴリズムがコンテンツの詳細を把握し、視聴者とのマッチングを通じて適切なコンテンツ推奨を行います。これらのプロセスでは、以下のAI手法が利用されています。

（3）最適なコンテンツ体験を実現

　視聴者体験、いわゆるユーザーエクスペリエンス（UX）の向上を目的とするAI活用で、AIが活用される主な領域としては、ユーザーインタフェースとコンテンツ配信が該当します。　

（4）視聴者にアピールするコンテンツの制作

　コンテンツ制作の様々なプロセスにおいて、AIを活用した自動処理化を進め、人手では実現できない品質とスピードで、コンテンツの制作効率を各段に向上しています。

　サムネイル画像は限られた情報を瞬時に伝達するメリットがありますが、シズルリールは、連続的なコンテンツの断片を通じて視聴者の想像力を刺激し、短時間で判断を促すことができるメリットがあります。ネットフリックスにとっては、これらの両方が視聴者とのエンゲージメントを高めるために大変重要なアセットとなっています。

（5）コンテンツ制作の意思決定

　2024年にネットフリックスがコンテンツ制作に割り当てる予算は170億ドル（約2.5兆円）に達します。ネットフリックスは、この巨額のコンテンツ制作予算の投資判断においても、AIを活用しています。

4. AI活用の具体例

　ネットフリックスならではのAI活用例として、サムネイル画像とプロモーション動画の作成について、少し踏み込んで紹介したいと思います。　

4-1. サムネイル画像の作成

　サムネイル画像の作成を支援するネットフリックスが開発した「AVA：Aesthetic Visual Analysis（美的視覚分析）」を紹介します。このAVAは、ビデオコンテンツから静止画フレームを自動抽出して評価するアルゴリズムとツールによって構成されるシステムで、個々の視聴者にパーソナライズされたコンテンツ推奨を行う際に、視聴者のアクションを引き出す重要なトリガーとなるサムネイル画像の制作効率を各段に引き上げるために開発されました。

（1）AVAが開発された背景

　従来ネットフリックスでは、制作スタジオから提供されるサムネイル画像を使用していましたが、スタジオから提供されるこれらの画像は、元々が道路沿いの広告看板用に作成されていたものであったり、DVDのジャケットアート用として作られたものであったりと、スマホやPCなどを利用するネットフリックスの視聴者の環境には不適切なものが多く、ネットフリックスは、これではネットフリックスの望む効果が得られないと判断。その結果、自社でサムネイル制作を手掛けるようになりました。
　当初は、ビデオ編集者やデザイナーがビデオコンテンツから抽出した静止画フレームを加工していましたが、増加するタイトルや視聴者環境の多様化より、手作業で続けるのが困難になりました。このため、AIを含むテクノロジーの活用するAVAが開発されることになりました。

（2）AVAの機能

　AVAによるサムネイル画像の制作プロセスでは、様々にAIが重要な役割を果たしています。以下の①②③に分けて紹介して行きます。

　　① 動画から静止画フレームの抽出
　　② 静止画フレームのメタデータによる客観判定
　　③ 静止画フレーム候補の評価・選定

① 動画から静止画フレームの抽出

　ネットフリックスは、コンテンツタイトルから、数百～数千の静止画フレームをAIを利用して自動抽出します。例えば、1時間の場合、抽出する静止画フレームは、約8万6,000におよび、それらが3シーズンに分かれて、各々8エピソードあるとすると、200万を超える静止画フレームを生成する必要があります。そして更に、その中から視聴者の関心を惹くフレームを選定する必要がありますが、これはもう人間の手で処理できるレベルではなく、AIの助けを借りることになります。

② 静止画フレームのメタデータによる客観判定

　抽出された静止画フレームで表現されている内容を説明するためにメタデータにアノテーション（タグ付け）を行うことで、このフレームがなぜ重要なのかを人間が客観的に理解できるようになります。これらの処理には、多くのアルゴリズムが用いられていますが、フレームに付与されるアノテーションは、以下の3つのカテゴリに大類することができます。

（a）視覚的メタデータ（Visual Metadata）
　画像の明るさ、色調、コントラストやモーションブラーなど、ピクセルレベルで表現される客観的に測定可能なメタデータです。

（b）コンテキストメタデータ（Contextual Metadata）
　フレーム内の俳優やその動き、カメラショットの識別やオブジェクト検出などを行い、これらの要素の組み合わせからコンテキストを表現するメタデータで、顔検出やモーション推定、カメラショット識別や物体検出などのコンピュータビジョン技術による出力を利用します。　

（c）コンポジションメタデータ（Composition Metadata）
　ネットフリックスが定義する評価特性に基づくメタデータで、写真や映画、視覚的美学に基づく基本原則（三分割法則、被写界深度、対称性）を反映したものです。

③ 静止画フレーム候補の評価・選定

　抽出された静止画フレームがネットフリックスの求める美的性質、創造性、および多様性の基準を満たしているかを判断するアルゴリズム処理が行われます。このアルゴリズムの評価を通過すると、最終稿となる静止画が選出され、クリエイティブチームの最終工程に引き渡され、サムネイルが完成します。この最良のフレームが選定される際に考慮されるのが、以下の俳優、フレームの多様性、成熟フィルターの3要素となります。　

（a）俳優の役割と顔データの処理
　俳優はコンテンツにおいて常に重要な役割を果たすため、顔データのクラスタリングを通じて主要キャラクターを特定します。この処理には、映画フレームから抽出された約2万の顔のデータセットで訓練したCNN（Convolutional Neural Network：畳み込みニューラルネットワーク）が使用されます。CNNはキャラクターの登場シーンや登場頻度、顔の向きやポーズなどを分析し、主要キャラクターを特定して優先度を上げ、脇役やエキストラの優先度を下げます。
　さらに、キャラクターの目のまばたきや、話している最中ではないか、画像にブレがないかなどの要素を評価して、品質の悪い静止画フレームを省きます。

検出した顔に対するクラスターに基づく重要度スコアリング（出典：Netflix Research）

（b）フレームの多様性
　多様性の評価は、主観的な要素が強い分野であり、様々な評価方法が存在しています。ネットフリックスの多様性の評価では、以下の変数を組み合わせ、ベクトル化してクラスタリングを行います。また更に、複数のベクトルを組み合わせることで、そのタイトルの候補画像の多様性スコアを付けることが可能となります。

（c）成熟フィルター
　成熟フィルターは、センシティブなコンテンツと視聴者の保護を考慮した重要な機能です。暴力シーンやグロテスクな描写、性的表現や知的財産権の侵害など、有害と考えられるフレームや攻撃的な内容を含むフレームを除外します。この成熟フィルターによって、視聴者に適切な内容のみが提示され、不適切な画像がサムネイルとして選ばれることを防ぐことができます。

（出典）Netflix Research

4-2. プロモーション動画の作成

　ネットフリックスにログインするとホーム画面上に表示される動画が再生されますが、これの再生される短いプロモーション用の動画をシズルリールといいます。このシズルリールは、人の手で編集して完成するものですが、その編集には、時間とコストがかかり、特にネットフリックスの得意とする視聴者のレコメンデーションに利用するメディア素材としては、不適切であると考えられてきました。　
　しかしながらネットフリックスは、視聴者にパーソナライズされたシズルリールをオンデマンドに作成できる「ダイナミックシズル」と呼ばれるシステムの開発に成功し、運用を開始しています。　　
　このパーソナライズされたシズルリールは、単一タイトルのコンテンツを編集するものではなく、複数の異なるタイトルの複数のシーンによって構成される視聴者にパーソナライゼーションされた、非常にユニークな体験をもたらすシズルリールとなっています。　
このダイナミックシズルの主な機能を紹介します。　

（1）メガアセット

　メガアセットとは、様々なタイトルで構成されたビデオクリップの大規模ライブラリで、各々のビデオクリップには、時間の流れを示すタイムライン情報とAIにより拡張されたメタデータが付与されています。ダイナミックシズルは、このメガアセットからビデオクリップを取り出し、それらを様々に組み合わせることで、何百万もの異なる視聴者に対してユニークなシズルリールを生み出すことが可能です。　
　下図は、メガアセット内に格納されるクリップデータのイメージですが、この例では、1つのタイトルのクリップを異なるフレーム長（160、80、40のフレーム長）にして、個々のクリップを容易に取り出せるようになっています。

メガアセットに格納されるクリップのイメージ図

（2）ケイデンス

　ケイデンスは、シズルリールの全体の長さをあらかじめ定めた上で、ダイナミックシズルが取り出すクリップの再生順序や再生時間などの条件を定義するもので、クリップの組み合わせパターンのコレクションといえます。　ケイデンスは、シズルリールの再生が破綻せずに、うまく再生されることを保証する他、パーソナライズまたはランダム化が可能なことから、シズルリールの多様性を確保することができます。　
　以下は、ケイデンスの例ですが、パーソナライゼーションの優先順位として、タイトルAが最も優先度が高く、タイトルBの優先度がそれに続いています。このケイデンスは、ブラックスクリーンに始まり、ブラックスクリーンで終わる構造となっており、その間を赤色、緑色、紫色で区分される3つのセグメントによって構成されおり、タイトルAからタイトルEまでの5つの異なるタイトルが各々に異なるフレーム長を持って、赤色→緑色→紫色の順番に従って再生されるよう定義されています。

（3）パーソナライズされたシズルリールの作成

　ダイナミックシズルは、シズルリールのリクエストを受けると、メガアセット内にどのようなタイトルがあるかを判断し、リクエストに基づいてパーソナライズされたリストを作成します。この際、ランキングシステムを用いて、上位にランキングされるタイトルがより再生されやすいよう重み付けを行います。このようにして生成されたシズルリールは、前述のケイデンスの定義に従ってクリップ再生がなされます。

（出典）Netflix Research

御礼

今回の記事は、以上です。　

最後までお読み頂きまして誠に有難うございます。　今後ともどうぞよろしくお願いいたします。　

だうじょん

#企業分析
 #テクノロジー
 #ネットフリックス
 #Netflix
#AI
#生成AI
#米国株
 #株式投資
 #AI銘柄

この記事が参加している募集

#お金について考える

42,152件

この記事が気に入ったらサポートをしてみませんか？