見出し画像

Adobe『Firefly』と生成AIのデータセット

この記事はCC0で公開します。加工や再配布、販売などあらゆる目的で挿絵も含めて自由に使えます。

ライティングなどお仕事のご依頼やお問い合わせはTwitterアカウントのDMまで。


Adobeの生成AI

vegetables, game asset, top down, centered, plain background

ついにAdobeが独自の生成AIプロダクト『Firefly』を発表しました。

AdobeにはAI関連機能を束ねる『Sensei』というブランドがありますが、FireflyはSenseiとは別ファミリーであるとFireflyのFAQで述べられています。そしてSenseiにはGenAIというよりエンタープライズ向けのプロダクトも存在しており(Adobe Sensei GenAI)、しかし同時にFireflyも紹介されたり、WebもSenseiの一部であるかのようなの構成、という分かりにくい状況です。

無理やり整理すると、Senseiという包括的なAIブランドがあり、ここにはエンタープライズ向けの『Sensei GenAI』というプロダクトがある。これはマーケティングなどが中心で、様々なビジネスプロセスの改善を助ける。
一方、より汎用的な生成AIの新しい独立したプロダクトとして『Firefly』が登場した。Fireflyはまず、文字から画像の生成(Text To Image、t2i)、テキストエフェクトの生成(text effect generation)から始める。今後より機能を拡充し、Adobeの他のプロダクトからも利用を進める。そしてSensei GenAIからも、Fireflyを利用する機能も提供される、といった状況でしょうか。

Senseiブランドの立ち位置と、生成AIの新たなプロダクトが欲しいという条件を考えると、こうした分かりにくい状況も仕方ないのかもしれませんが、ちょっとややこしいです。
生成AIの強力さを考えると、いずれSensei全体を呑み込むほど大きな存在になりかねず、特にクリエイティブ領域では、AI = 生成AIとなってしまいそうな勢いなので、どこかでクリエイティブ向けとエンタープライズ向けで、リブランディングを迫られるかもしれません。

ちなみにFireflyなのにブランドイメージっぽい画像に蛍が登場しないのは、昆虫への嫌悪感を考慮してでしょうか?

Fireflyの特徴

imaginary animal.

今の所、正式にリリースが発表されている機能は「テキストから画像」「テキストエフェクト」だけですが、「ベクターアートのカラーバリエーション生成」が近日公開予定です。またその他にも以下の実験中の機能が挙げられています。

  • 修復

  • 特定描写の追加学習

  • ベクターアートの生成

  • アウトペインティングによる画像の拡張

  • 3Dデータから画像生成

  • シームレスパターンの生成

  • ブラシの生成

  • スケッチからフルカラー画像の生成

  • テンプレートデータの生成

多くがStable Diffusion系のオープンな開発で達成されていたり、Stability AIが提供するPhotoshopプラグイン(https://exchange.adobe.com/apps/cc/114117da/stable-diffusion)に近いものですが、ベクターデータやテンプレートなどは先行事例も乏しく期待しています。

とはいえAdobeが生成AIに取り組む最大の価値は、こうした機能がAdobeの強力なツールセットと直接連動していく点です。

Photoshopでラフスケッチからリアルで非現実的な背景を生成し、Illustratorでキャラクターや小物、装飾されたテキストを生成したら、InDesignで生成したテンプレートに流し込む。条件を流用してPremierでもテンプレートを生成し、同じ素材を使い、エフェクトやトランジションを加え、Auditionで生成した音声で彩る。

Fireflyは、そんなプロユースのツールセットと生成AIが結びつく、強力な未来の始まりとなることを期待されています。

なおFireflyはベータ中、生成結果を商用利用できない旨が明示されているため、注意が必要です(Firefly FAQ for Adobe Stock Contributors)。

データセットの明言

Fireflyの発表には生成AIの学習に用いるデータセットへの言及があり、Adobe側もこの点をアピールしたい姿勢が見えます。これは昨今の生成AIの盛り上がりの中では、やや珍しい方針です。

・AI Art Generator – Adobe Firefly
https://www.adobe.com/sensei/generative-ai/firefly.html

データセットについてFireflyはとても「お行儀良い」方針を採っています。自社のストックサービスであるAdobe Stockの作品、ライセンス上問題ない著作物、そしてパブリックドメインによって構成した、としています。

Adobe Stock作品の利用

a house crazy style

Adobe Stockの作品には提供元が2種類あります。

ひとつはAmanaimagesなど大手のストックサービスから供給されるもので、おそらく包括的な契約の元で提携しているのでしょう。今回のFireflyではこのタイプの作品がデータセットに含まれるか言及されていませんが、含めるにしても個別で契約の追加等が必要でしょう。

もう一方は「コントリビューター」による作品。Adobe Stockには個人などが作品を提供し収益化できる仕組みがあり、提供者はコントリビューターと呼ばれます。コントリビューターはAdobe Stockに作品を提供する上で、一律の契約を結ぶ必要があり、以下はその日本語の最新版です。

Fireflyの発表では、この契約に従ってコントリビューターの作品がデータセットに含まれるとされています。契約内容には生成AIの学習に利用するといった直接の言及はありませんが、"1. アドビに対するライセンス許諾"内に"新機能およびサービスの開発"とあるため、これに包括されそうです。

Adobe Stockの、特にコントリビューターの作品をデータセットとすることは、契約上は権利関係に問題がないことを保証します。もちろん悪質なコントリビューターが他者に権利の存続する著作物を提供したりする可能性はあります。それでも、契約によってそうした行為が制限されていること、そして公開される作品には一定の浄化圧力があることは考えられます。

なぜ「Stock + パブリックドメイン等」なのか

Fantasy machine. fantasy world. cinematic. professional photographer

2022年7月以降の生成AIの爆発的な盛り上がり以降、Adobeは苦しい決断を迫られたのではないでしょうか。

生成AIを採用しないという選択は、将来の生産性や利便性を考えると命取りです。一方で無闇なデータセットを用いる事は、これもまた命取りになりかねません。なぜならAdobe製品のユーザーのほとんどは、今も日々、学習対象となりうる作品を作り続けるアーティストだからです。

Adobeとしては、生成AIという絶対的な革新を十分取り込みながら、現在の顧客たちが抵抗感や反感を抱かない形で、できるだけ早く製品を提供しなければなりませんでした。そういう状況では「Adobe Stockの許諾済作品 + パブリックドメイン等」というデータセットの選択は、他に選びようの無いものだったのかもしれません。

この選択は更に、他の生成AIに比べ、権利関係の明確さという圧倒的な利点もあります。判例も無い状況で、誰もが実験的に生成AIの商用利用を、いつリスクに直面するかも分からないまま、怖々使っている状況はいかにも不健全です。自社管理下の作品と、パブリックドメイン

問題はそうしたデータセットがもたらす生成の品質です。データセットの量や質が生成結果の品質に直結することは明らかで、もしそれが他のプロダクトに大きく劣るようであれば、データセットの見直しも必要になるかもしれません。

あらゆるアーティストの最新の作品まで、配慮一切なしで学習するのに比べて、Adobeの方針はかなり大きな制約です。今回Fireflyという形で大きく発表した以上、Adobeはこのストイックなデータセットのもたらす品質に一定の自信が得られたのでしょう。

作品の権利透明性

Adobeは以前から、デジタルコンテンツの権利などの透明性確保を目指すContent Authenticity Initiativeの立ち上げや、来歴情報の標準化を行うC2PAなどにコミットしてきました。

Adobeがアーティストの既得権保護にコストを割くのは当然で、自社製品のユーザーとビジネスを守るものです。生成AIという激変がもたらす混乱にも、既得権と未来双方にバランスを取りながら、透明性確保によって一定の秩序をもたらそうと苦心しているでしょう。

そうした立場のAdobeが世に出すFireflyでは、生成された画像にAIによって生成されたことを示すContent Credentials タグを付加する、とFAQで述べられています。

こういった権利系の付随的な技術が、世界を覆い尽くすほど普及するケースはまず考えられませんが、生成AIの法整備が進む中で、C2PAや類似の技術が言及する可能性はあるかもしれません。
また、たとえ一部にしか普及しなかったとしても、生成AIのデータセットに厳密な権利処理を求める場合、こうした情報の参照可能な作品のみを扱うといった基準も可能になるかもしれません。

追加学習ビジネスモデル

photo of a stand alone Cat motif knick-knack shop item. Studio Lighting. pottery.

十分な表現力を持った権利関係の明確なベースモデルがあれば、追加学習も促進されます。どれだけ安全なデータセットで追加学習をしようと、ベースが怪しければ商用利用は難しくなります。

Fireflyのモデルであれば、Adobeが審査済のデータセットを使っていることで、権利だけでなく、必要なデータセットの提案などもしやすいでしょう。大規模なプロジェクトであれば、Adobeが直接そうしたサポートを行い、そこでまたコントリビューターというデータソース源が活用できるかもしれません。

手軽な追加学習はこの先必須で、特に商用利用では不可欠でしょう。多くの企業が自社モデルデータを構築し、自社製品の検討や広報に利用していく筈です。権利関係が明確だからこそ、企業は自社モデルの基盤としてAdobeを選択する強い理由が生じます。

コントリビューターへの利益還元

photo of beautiful hills. Flowers. Little bird. silence and peace. photorealistic, cinematic lighting, volumetric lighting.

FireflyのFAQや、Fireflyに関するStockのコントリビューター向けのFAQ(Firefly FAQ for Adobe Stock Contributors)では、コントリビューターへの利益還元に触れています。

ベータ終了後に詳細を出すというぐらいで、まだ報酬体系は何もわかりません。しかしここまで大規模な画像生成AIのデータセット提供者に報酬を支払うという事例は、おそらく世界で初めてでしょう。自社の管理するStockコントリビューターが対象だからこそ、現実的なコストでそうした還元が可能になります。

数億枚もの作品に報酬を支払う以上、寄与度を考えても、個々の作品に対する報酬は微々たるものでしょう。しかしほんの僅かであっても、これは大きな変化です。

コントリビューターにとっては、Stockに作品を提供すれば直接の利用がなくとも報酬が得られる。Adobeにとってはより高品質なモデルデータを提供してプロダクトが価値を増して利益が増える。こうした旧来的で健全なエコシステムが上手く動き続けてくれるかは、生成の品質と報酬額、そして法整備などに左右されます。

生成AIとデータセット

Photo of an antique Magic Ring. mighty power, Professional photographer, detailed expression, impressive lighting.

画像生成AIは、データセットの扱いで強い衝突があります。それは学習という新しい利用とその成果が、アーティストの既得財産については、その価値を減らす方向でしか機能しないためです。

今は個人のクリエイターが多い画像分野か、誰もが著作者たり得て生成粒度の低い言語分野が中心のため、この衝突はそこまで大規模ではありません。しかし商業音楽や映画、報道といった分野まで生成AIが進展すれば、ロビーなど派手な動きが強まり、血みどろの末に法整備まで延焼していくでしょかもしれません。

そうした日に至る前に、もう少しデータセットの権利や扱いについて、ユーザーであっても意識を向けた方が良いと私は考えています。AdobeのFireflyは製品そのものへの関心もありますが、データセットの扱いという面で非常に刺激的です。

データセット方針の第3極

African pattern symmetry, white background, ink line, vector.

Fireflyが現れるまで、主な画像生成AIのデータセットの取り扱い方針は2つに分かれていました。

ひとつは秘匿。これは口火を切ったOpenAIのDALLE2や、品質で先頭を走るMidjourneyが採っています。データセットの概要すら具体的には出さず、その方針すらきちんと明かされてはいません。更に、コードやモデルデータも非公開です。

もうひとつは公開で、これはStable Diffusionが採っているものです。LAIONという非営利団体が検索エンジンと似たような方法でWebから収集して構築したデータセットを採用しおり、データセットの内容は以下のページなどから検索すら可能です。

Stable Diffusionはオープンソースとして、コードとモデルが公開されています。

AdobeのFireflyはこのいずれでもなく、データセットの概要を開示しつつ、契約済のものだけを使う、という第三極となります。コードやモデルデータはもちろん非公開です。

データセットはどう扱われるべきか

Fine etching. Sci-fi, clear, contrast.

何の権威も権限も無い私個人の意見にすぎませんが、生成AIと従来的な著作の最低限折り合える生成AIへの制限が、「データセットを秘匿しない」と「オプトアウトを受け入れる」というルールだと考えています。

生成AIは避けようのない利便性をもたらし、著作という行為そのものの意味合いを大きく変えて、おそらく数年で、全く違った利益がより多くの人に届くはずです。しかしそれが既存の著作権への配慮を一切無視して進むのは、あまりに無為な衝突が多過ぎます。
かと言って、データセット全てに許諾と報酬を、といった制限もまた、生成AIの価値を損ねる大きな損失です。そこで考えられる最低限の条件が、オプトアウトを受け入れ、データセットを秘匿しないという2点です。

オプトアウトはともかく、データセットを隠さないからといって、既存の著作権者からすれば、自分の著作物の学習が防げるわけでもなければ、直接的な自分風の生成を不可能にするわけでもありません。
しかし表現の類似を問う際に、データセットに自分の著作物が含まれているか否かは、重要な判断基準となりうるのではないでしょうか。またオプトアウト遵守の確認も、秘匿されていれば不可能です。

データセットを隠さないことで、生成AIの提供者側からすれば、容易に同じような学習が他者によって可能になり競争力が低下します。
しかし生成結果を商用利用しようとした際に、データセットが法的に問題を抱えていないことは、まず一番に求められる条件ではないでしょうか。生成AIによって生じる問題が増えれば増えるほど、身綺麗でいる要求も増えるのではないでしょうか。

このどちらにも中途半端なルールぐらいが、将来性と実行性を保ち、既存の権利を完全には蔑ろにしない、現実的なラインだと考えています。

既存の著作者の中には、作風自体に著作権をと、根底からの見直しを求める声もあります。しかし著作権は表現に与えられるもので、作風やアイデアといった表現の背後にまで踏み込んで与えられるべきではありません。それは著作権という道具を運営してきたこの100数十年ほどで積み上げられてきた知恵です。そもそも自分の著作物自体が、誰かの作風に類似していないと言える著作者はどれだけいるでしょうか。
オプトアウトした上で、開示されているデータセットを根拠に、表現の類似性・依拠性を問う、という以上を求めるのは危険です。

安心なデータセット

bomb. fantasy world. cinematic. professional photographer

Stablity AIの提供するStable Diffusionは、次のバージョン3で大々的なオプトアウトを受け入れ、上記のルールに概ね沿ったデータセットの扱いとなります。コードがオープンであることも含め、私は従来、Stable Diffusionを主として使い、この記事の無関係な挿絵も全てそれで生成しています。

かといって、他の画像生成AIを使わないわけではありません。避けてはいますが、表現がMidjourneyにしか難しい場合には使います。生成の質が不十分なDALLE2は使っていませんが、品質が上がれば使うかもしれません。
さらに言えば、自分の考えるルールに全く則っていないLLMのChatGPTは多用していますし、その他にも音声や動画など、データセットが必ずしも明らかでなかったり、オプトアウトの対応が無い生成AIも使っています。

しかし商用利用となると、今の時点ではStable Diffusion 2.1とその派生だけを使っています。データセットの秘匿が抱えるリスクが、画像に於いては危険という個人的な判断からです。

同じような判断をしていたり、あるいはもっと厳しく、Stable Diffusionですら危険だからと使わない潜在的な生成AIユーザーは、きっと無数にいるでしょう。そこへAdobeのFireflyが「うちなら権利明確なデータセットで生成AIのパワーを存分に活用できますよ」と謳えば、これまで手控えていたユーザーに一気に広がる可能性を持っています。

データセット三様

Marble sculpture of Unknown Fantasic creature. Studio lighting.

データセットのクリアなAdobe、オープンなStable Diffusion、クローズなMidjourneyが並ぶことで、商業的にも法的にも、画像生成AIには動きがあるかもしれません。

もちろん品質やコードのオープンさ、費用など色々な要因がありますが、商用利用時にAdobeを選ぶべきという圧力は高まるでしょう。そうした声が多ければ、法制も影響を受けるかもしれません。

Stability AIは、Adobeとはまた異なる公正さを目指していますが、それはよりドラスティックなもので、Stable Diffusionの1.x・2.xと徐々に配慮を増やしています。Stable Diffusion 3では、オプトアウトに対応することで、2.xで落ちたと表現された部分を補うデータセットを積極的に活用するかもしれません。
Adobeに対してはコードがオープンであるという最大の利点があり、活発なコミュニティが圧倒的です。

Midjourneyは生成の品質が大きく先行していますが、Adobeというもうひとつの比較対象が現れたことで、積極的な商用利用を避けられる可能性が生まれました。v5ではすでに魔法のカメラと言える実写表現力なので、活用したい企業からはデータセットを問われるかもしれません。

おわりに

symmetrical ornament floral elements

Adobeという待望のビッグプレイヤーが、明確な権利処理という武器を掲げて殴り込んできたお陰で、画像生成AIにはまたこれまでと違った動きが起きそうです。

私自身は早速Fireflyのクローズドβ申し込んで、製品化されれば多分使い倒すと思います。しかしやはり気になるのは、お行儀の良い大人なFireflyが、どれだけの生成品質が出せるのか、また他のプレイヤーや法整備にどういった影響を与えるかです。それと、データセット寄与者への報酬というエコシステムが、どこまで上手く循環するか。これが成功するなら、他のプレイヤーも同じような報酬額で、データセット集めを始めるかもしれません。
相変わらず、毎週毎週大きな動きがあって楽しいです。

なお、この記事にはChatAIは一切使っていないので、将来的にLLMのデータセットが万が一問題になっても、CC0で配布可能です。

この記事が気に入ったらサポートをしてみませんか?