いらすとや×AI:画像生成AIが変える商用画像の未来
三嶋隆史(東京工業大学/AI Picasso(株))
尾崎安範(AI Picasso(株))
冨平準喜(AI Picasso(株))
みなさまはインターネット,特にSNSは普段から使用されていますか? 最近,SNSで共有される画像に大きな変化が見られます.これは,生成人工知能(AI)技術が画像制作に広く用いられるようになったためです.特に2022年から,生成AIを使った画像の品質は飛躍的に向上しています.たとえば,X(旧Twitter)やInstagramに投稿される人物の写真が,実際の人間によるものかAIによって作られたものか,区別が難しくなってきています.また,人間が描いたようなイラストもAIによって多く生成されてきています.この技術の進化について,一部の研究者は画像生成AIの能力は90%以上の人間の能力を超えていると主張しています¹⁾.
そこで,本稿では画像生成AIの動向を説明し,画像生成AIが生まれたことに起因する課題をまとめました.続いて,画像生成AIの活用事例としてAI Picassoのサービスである「AIいらすとや」²⁾を紹介します.
画像生成AIの動向と課題
画像生成AIの動向
みなさまは画像生成AIの火付け役,Stable Diffusionをご存知ですか? 2022年の8月末にイギリスのスタートアップ企業であるStability AIがStable Diffusionをインターネット上に商用可能な形で開放してから,画像生成AIは急速に発展してきました.ここから,他社も商用利用に参入し,競争は以前より激しくなってきています.たとえば,画像編集ソフトPhotoshopを提供しているAdobe社もAdobe Fireflyを商用利用可能な形でサービス提供し始めました.Photoshopは画像編集ソフトのデファクト・スタンダードであるため,ほとんどのプロクリエイターが現場で利用しています.ここから画像生成AIの商用利用が本格化していくことが予想されます.最近では,対話式AI,ChatGPTで有名なOpenAI社がDALL·E 3を開発しています.ChatGPTと統合されているために,プロの漫画家の間では使い勝手が良いだとか,ビジネスマンの間では日常的に使うとかと話題となっています.
さて,これらの画像生成AIはどのような仕組みで動いているのでしょうか.画像生成AIで画像を生成するには,プロンプトと呼ばれる自然言語で書かれた文章を使用します.プロンプトには,AIの学習過程で覚えさせた概念を使うことができます.このため,Stable Diffusionをはじめとする画像生成AIは多くの概念を大量の画像で事前に学習させています.これにより,プロンプトに応じたさまざまな画像を生成することができます.さらに単語との間の関係を踏まえて,画像生成AIが自動的に背景などを補完してくれます.一方で,細かく調整したい場合は,プロンプトとともに参考画像や指示画像を入力することで生成画像を詳細に指定することもできます.
画像生成AIの課題
ところで,Stable Diffusionをはじめとする画像生成AIは,事前に多くの概念を大量の画像で学習させたことにより問題が生じました.なぜならば,画像生成AIの学習に使った画像に著作権があるからです.また,生成画像が著作権を侵害することはあるのかという問題もあります.著作権の問題という観点では,学習の問題と生成の問題を区別して考えることが必要です.
日本の著作権法第30条の4に基づき,学習目的での著作物利用は原則として許可なしで可能です.これは,文化庁によっても明確にされています³⁾.しかし,具体的な判例がないため,この権利制限規定の適用範囲は依然として不明確です.また,法的な制約と倫理的な制約は異なることを認識する必要があります.我々は,クリエイターの権利を尊重しつつ,AIを利用する利便性を高めるバランスを取ることが重要だと考えています.
生成画像の公開については,人がAIを利用せずに書いたものと同様の基準で判断されます.多くの画像生成AIのモデルには,著作物が学習データとして含まれているため,プロンプトや参考画像を著作権を意識せずに使ってしまうと,著作権侵害になってしまう恐れがあります.そのため,画像生成AIを使うユーザ各々が著作権に対する意識を持つことが必要です.
画像生成AIの活用事例 「AIいらすとや」
ここまで説明したような動向や課題をもつ画像生成AIですが,画像生成AIの活用先は多岐に渡ります.実際にAI Picassoにも,アニメ・漫画の作成への活用,広告のバナーとして活用,特定の画風を出力するシステムへ活用を求めて多くの会社からご連絡があります.
ここでは,AI Picassoがいらすとや公式と提携をした上で開発し,クリエイター還元モデルを実現した「AIいらすとや」を具体例に挙げて画像生成AIの活用事例を紹介します.
「AIいらすとや」とは
「AIいらすとや」は,図-1のような,いらすとや風のイラストを生成することができるサービスです.AI Picassoが運営しているAI特化の素材サイト「AI素材.com」の中で利用することができます.生成画面では,プロンプトや参考画像に加えて,いらすとや特有のキャラクターを指定することができます.
AIいらすとやを支える技術
「AIいらすとや」は,いらすとやが保有しているイラストをAI Picassoの画像生成AIに学習させることで開発しました.この作り方をAI PicassoのAIエンジニアである尾崎が解説します.大枠では図-2のとおりです.
図-2は,いらすとやの画像-文章ペアとAI Picassoの基盤モデルを組み合わせて,特化したAIを作り出していることを示しています.画像-文章ペアとは,図-2の左上にいるオレンジ色の服の女性の画像とその説明である「靴紐を結ぶ女性」にあたります.基盤モデルとは,先ほど説明したStable Diffusionのような多くの画像-文章ペアを学習した汎用的なモデルです.なお,DALL·E 3やAdobe Fireflyも基盤モデルに当たるため,基盤モデルは必ずしもStable Diffusionとは限りません.今回の場合は,AI Picassoが用意した基盤モデルにいらすとやの約3万画像-文章ペアを徹底的に学習させました.いらすとやの画像だけではなく,筆致をも学習させます.これによって,いらすとや風の画像だけが生成されるような状態となり,他の画風のイラストや写真のような画像を生成しないようにすることができます.
クリエイター還元モデルの実現
AI Picassoはいらすとや公式と提携をした上で,いらすとや風の画像を生成できるサービスを提供しています.その証拠に,いらすとやのページにAIいらすとやへのリンクが貼られています⁴⁾.AI素材.comの収益の一部をいらすとやの運営者である,みふねたかしさんに分配しています.これにより,クリエイターへ還元するビジネスモデルを実現しています.
このようにクリエイターへ還元するビジネスモデルにはデザインや品質に対する同意を得ることも大切です.AI Picassoは,AIいらすとやをリリースする前に,みふねたかしさんとWebサイトのデザインや生成画像の品質を確認していただいた上でリリースしています.
未来に向けて
今回,商用画像サービスの例としてAIいらすとやを紹介しました.このように取り組むことで「文化の発展に寄与すること」にエンジニアが貢献できる未来があるのではないでしょうか.
参考文献
1)Morris, M. R. et al. : Levels of AGI : Operationalizing Progress on the Path to AGI, arXiv (2023).
2)AI Picasso(株),AI いらすとや (2023), https://aisozai.com/irasutoya
3)文化庁,AIと著作権 (2023), https://www.bunka.go.jp/seisaku/chosakuken/93903601.html
4)みふねたかし,いらすとや (2023), https://www.irasutoya.com/
(2023年11月15日受付)
(2024年1月9日note公開)