見出し画像

画像生成AI「Midjourney」の脅威

今年の8月に発表されたばかりのアメリカ製の画像生成AI「Midjourney」が、爆発的に流行っている。上の2つの画像は、我輩が早速利用して生成したものだ。まだ使い勝手が分からず無料のβ版を使ったので、クオリティの低い画像しか生成できていない。それでも半日程度調べて、欲しい画像の単語を入力するだけで、このような画像を1分で生成してくれたのだから恐れ入る。ちなみにこの画像は「未来の東京に立っている巨大ロボット」と「広い花畑で飛ぶ蝶」という指定だ。

無料版は回数制限があるので、それほど試行錯誤できないが、月額10ドル程度支払えば数百回の画像生成が出来るので、世界中の人々が競ってクオリティの高い面白い画像を大量に生成している。あまりにクオリティが高い画像を得られるので、プロのイラストレーターが描いたものと区別ができないほどだ。著作権は利用者にあり有料版なら商業利用もできるので、最初はプロのイラストレーターがアイデア出しのツールとして利用するだろうが、すぐにイラストレーターに依頼する側のクライアント自らこのツールの利用を始めるだろうな。β版なので使い勝手や機能がマダマダなのだが、AIの世界では数か月もあれば急速に進化できるはずだ。

それにしても、AIというかディープラーニングを利用したGANを代表とする画像生成技術は、数年前から脚光を浴びていた。それが人と会話ができるGPT3のような高度な自然言語処理技術と融合させることで、一気に進化したようだ。創作はAIが唯一できない領域だと思われてきたが、ユニークな画像を瞬時に生成してくるこのツールを見せつけられると、人間の持つ創造性とやらも、こんなもんかと思えてくる。

このMidjourneyは、原理的には膨大な量の教師画像を学習しており、指示コマンド(言葉)に近い候補画像を複数選び、その画像に近似した画像を生成していると思われる。だから教師画像にない言葉だと、どうしてもクオリティは下がる。しかも画像生成に乱数を使っているはずなので、同じコマンドでも毎回違う画像を出力してしまう。このMidjourneyが得意とする画像は、ファンタジーやホラー、怪獣やロボットのような現実にない分野、しかもダークな雰囲気を得意としている。これは学習させた教師画像の多くが、ダークファンタジーのコミックやゲームのイラストが多かったかだろう。アニメファンが喜びそうな教師画像を大量に投入することで、人気を得ようとした作戦は成功しているように思える。しかし我輩が期待した「蝶」のリアルの画像は、やはりどうしても出せなかった。

このMidjourneyと同じような画像生成ツールは、OpenAIが「DALL-E 2」のベータ版を既に発表している。この出力画像も素晴らしく、アニメーターが不要になるレベルのクオリティになっていた。ユーザーにとっては喜ぶべきことだが、プロのイラストレーターやアニメーターにとっては脅威のテクノロジーとなる。このような画像生成AIは、数千万枚にも及ぶ莫大な量の既存のイラストを学習することで、「新しい」イラストを自動生成するが、学習画像の「利用料」は支払っているのだろうか?もしネットでスクレイピングして画像を収集していたとしたら、イラストレーターたちから集団訴訟を起こされることになるだろうな。

TickTackなエッセイ

TickTack制作のイラスト販売中
TickTack制作のイラスト一覧

このようなイラストを多数制作販売中


この記事が気に入ったらサポートをしてみませんか?