見出し画像

ニュースメディアが画像生成AIを実践導入する時に抑えるべき論点

9月21日に、OpenAIがDALL-E3という最新の画像生成AIを発表しました。現時点では、Bing Image Creatorなら無料で、ChatGPTなら有料プランに加入していると使用することができます。DALL-E3は性能の高さもさることながら、「日本語で指示できるようになった」ことで使い勝手が大幅に向上しました。MidjourneyやStable Diffusionなど、これまで主流だった画像生成AIツールでは英単語の羅列でプロンプトを作っていましたが、DALL-E3はユーザーインターフェースという点でも大きく進化しました。

Liquid Studio

DALL-E3以外にも、7月から9月の三ヶ月半で14個もの画像生成AIがリリースされています(X)。社会実装も着々と進んでおり、最近だとMetaやGoogleがセルフ広告プラットフォームに画像生成AIを統合し、広告主がクリエイティブ制作の補助ツールとして使用することができるようになりました。先週は、パルコがファッション広告に画像生成AIを使用したことが話題にあがりました。クリエイティブ制作では実際のモデル撮影を行わず、人物から背景にいたるまでプロンプトで構成され、グラフィック・ムービーの他、ナレーション・音楽も全て生成AIで作成しています(PR Times)。このように現時点では広告領域での活用例が多い画像生成AIですが、映画やゲームなどエンタメ領域での実践投入も始まっており、市場規模は右肩上がりに増加していくと予測されています。

Global Market Insights

このように、着実なプロダクトの進化とユースケースの開拓が順調に進んでいる画像生成AIですが、ニュースメディアでの活用可能性も様々です。これまでお客様と会話してきた中でも、連載記事のタイトルカット画像生成、事故現場や取材先の場所を伝える地図画像、キャンペーン用のキャラクターデザインなど様々なアイデアが出てきました。

今回の記事では、そのようなニュースメディアにおける画像生成AI利用について、「商用利用」「著作権」「世論」という3つの主要論点から現状や考え方をご紹介していきます。

主要な画像生成AI

最初に、主要な画像生成AIツールをいくつかご紹介していきます。

DALL-E3

DALL-E3は、前述の通り9月21日にOpenAIが発表した画像生成AIです。ChatGPTとBing Image Creatorから利用することができますが、ChatGPTの場合は有料プランに加入している必要があります。

Bing Image Creator - Official Microsoft Blog

Midjourney

Midjourneyは、その性能の高さから最も検索数が多い画像生成AIサービスです(Google Trend)。Discordというチャットアプリから使用することができますが、3月28日以降、有料プランへの加入が必須となりました。

Udemy

Stable Diffusion

Stable Diffusionは、日本にも支社があるStability AI社が開発している画像生成AIです。Dream Studioというツールから無料で利用することができます。

Gigazine

Adobe Firefly

Adobe Fireflyは、Adobe社が開発している画像生成AIです。上記のAIと異なり、Adobe社が権利を保有している画像とパブリックドメインの画像のみを学習データとして使用している点が特徴です。画像生成だけでなく、オブジェクトを塗りつぶして削除・変換したり、テキストにスタイルを適用するなど様々な派生機能が提供されています。無料で使用できる枠も用意されています。

321web

画像生成AIができないこと

現在の画像生成AIは、一部の禁止ワードなどを除き、適切なプロンプトを書けばイメージに近いアウトプットを出力することができます。ニュースメディアで想定されているユースケースに対しても、現在の精度であれば使用に耐える場合もあるでしょう。例えば、以下は「避難訓練」をテーマにしてBing Image Creatorで生成した画像です。災害や防災に関する記事のタイトルカットとして使用できる可能性があります。

Liquid Studio

このように「プロンプトに近いイメージの画像を生成する」という点ではそれなりの精度で出力できますが、それは逆に言えば「イメージに近い画像しか生成できない」ということも意味しています。つまり、ユーザーが欲しい画像を明確にイメージできている場合、その細部まで期待通りに生成することはできないということになります。

現在の画像生成AIに対してユーザーがどこまで細部をコントロールできるのかイメージするために、いくつか事例を示します。例えば、Inpainterという画像生成AIツールを使うと、生成された画像に写っているオブジェクトを別の物体に置き換えることができます。

Liquid Studio

Midjourneyにも、Varyという画像の特定箇所を指定して再生成できる機能が搭載されています。

また、精度は完璧ではないものの、Ideogramという画像生成AIでは特定の文字を生成することも可能になってきています。

Liquid Studio

このように考えると、紙面に掲載する地図など「情報の正確性が求められる」画像の生成はAIで対応できないと考えることができます。一方、記事のタイトルカットなど正確性よりもイメージが重要な画像は、AIの使用余地があると言えます。

また、「シード値」という生成した画像に固有のIDを指定することで、その画像と類似した要素を持つ画像を連続的に生成することも可能です。以下の例では、ChatGPTで生成した恐竜のキャラクターを、シード値を指定することで2枚目でも再登場させています。ただし、元画像と比べると類似性はありますが、完全に同一のキャラクターにはなっていない点は重要です。この場合でも、正確に同一キャラクターを連続的に生成したい場合はAIでは対応できないということになります。

Liquid Studio

シード値の求め方はツールによって異なりますが、ChatGPTの場合は「この画像のシード値を教えてください」とプロンプトで指定することで教えてもらうことができます。Midjourneyについては、こちらの記事をご覧下さい。

商用利用

ユースケースが存在すると仮定すると、次に気になるのは商用利用の可否でしょう。実際に商用利用する際は改めて各ツールの利用規約を直接確認することをお勧めしますが、現時点でBing Image Creator以外は商用利用可となっています。

Liquid Studio

著作権

また、著作権についても気になる方が非常に多いのではないかと推察します。AIが生成した画像の取り扱いについては、文化庁がこちらのページでわかりやすくまとめています。

文化庁

基本的には、「既存創作物の存在を知った上で、生成した画像が当該創作物と類似していると著作権侵害」と理解して良いでしょう。こちらについても、実践的に使用する際は専門家へ確認することをお勧めします。

世論

実践利用する際に、非常に重要だが忘れがちな論点が「世論への考え方」です。Adobe Fireflyなど一部を除き、画像生成AIはインターネット上の画像を無差別に収集し学習しています。当然、元画像を制作したクリエイターの許諾は取っておらず金銭的なリターンもありません。そんな画像生成AIを商用利用することは、ある意味クリエイターを搾取していると解釈されることもあります。例えば、DisneyはDisney+で配信しているMarvel's Secret Invasion」という作品のオープニングで、AIが生成した画像を使用しました。ハリウッドでは、つい先日まで俳優・脚本家団体がスタジオに対しAIの使用制限などを求めストライキを起こしていたことからもわかるように、AIがもたらす倫理的リスクがかなり敏感に議論されています。そのような社会的背景がある中、多くの雇用を抱えるDisneyがAIを実践使用したことはファンやクリエイターからかなり大きな批判を受けました(Gizmode)。

Marvel Studio

ちなみに、MarvelはLoki Season2のポスターでも生成AIを使用しています(Gizmode)。

また、ニューヨーク・タイムズ紙のベストセラー作家であるSarah J. Maasが出版したファンタジー小説『House of Earth and Blood』の表紙に、AIが生成した画像が使用された際も、ファンや小説家から大きな批判が上がりました。Bloomsburyという大手出版社が担当した作品だったため、「AIが人間から仕事を奪うことを助長する動き」と解釈されたのでしょう(The Verge)。

House of Earth and Blood

クリエイターへの社会的・倫理的懸念を重視するという観点は、ニュースメディアのAIポリシーにも反映されています。例えば、WIREDは以下の通り画像生成AIをストックフォトの代わりとして使用しないことをAIポリシー内で宣言しています。

特に、ストックフォトの代わりにAI生成画像を使用することはありません。ストック・アーカイブに画像を販売することは、多くの現役フォトグラファーが生活費を稼ぐ方法です。少なくとも、ジェネレーティブAI企業が、彼らのツールに依存しているクリエイターに補償する方法を開発するまでは、私たちは彼らの画像をこの方法では使用しません。

WIRED

The Guardianは明示的に画像生成AIの利用を禁止しているわけではありませんが、「使用するサービスやモデルは、著作物の許諾、社会への透明性、公正な報酬といった論点をどの程度考慮しているかによって決める」としています(The Guardian)。

対策として、学習元である画像の権利関係をクリアにしている画像生成AIを使用することが考えられます。例えば、前述のAdobe Fireflyは「Adobe Stockなどの使用許諾を受けたコンテンツのデータセットおよび著作権の切れた一般コンテンツ」を使用してトレーニングされています(Adobe)。また、画像が学習データとして使用された場合、そのクリエイターは収益分配を受けることができます。 実際に7月下旬の時点では約100万人のクリエイターが分配金を受け取る権利を有しており、そのうち約6%が10ドル以上還元されるそうです(Business Insider)。Adobe以外だと、ShutterStockやGettyImageもAdobeと同様、権利関係がクリアされた画像のみを学習データとする画像生成AIを提供しています。

ただし、クリエイターの権利を尊重した画像生成AIツールを利用しているという実態があったとしても、それが読者やファンに適切にコミュニケーションされるとは限らないという点については依然リスクが存在します。

Liquid Studioについて

Liquid Studioは、メディアエンタメ業界に特化した併走型コンサルティングスタジオです。生成AIなどの先端テクノロジーに強みを持ち、ビジネスと技術の両面からハンズオンでご支援致します。これまで、大手新聞社やデジタルニュースメディア、エンタメ系スタートアップ、雑誌社など多数の企業様に対し、社内セミナーや技術導入、戦略提案、オペレーション構築など多角的な支援を提供してきました。
HP: https://www.liquidstudio.biz/

この記事が気に入ったらサポートをしてみませんか?