見出し画像

お絵かきAIは、いらすとやを超えられるか

今話題のお絵かきAIであるStable Diffusionについて、一応私もプログラマーの端くれであるのと面白そうなのでちょっと遊んでみました。

適当に書いていますし、基本的に感想や空想でできていますので緩くお付き合い頂ければと。

いろいろなところで紹介されているので遊び方なんかは簡潔にいきます。

遊び方

試すだけ

一番簡単なやり方。
お試しサイトがあるのでそこで遊べます。
画像解像度かなり低いので、軽く試す用。

十分な環境が無い方

グラボはCUDAを使う関係でNVIDIA製のいいやつが必要で、一応なくても動くけど画像の生成に数十分とかかかるらしいので、その場合だとGoogle Colaboratoryでやるのが一番良さそうです。
私はこの方法で試しました。

十分な環境がある方

ローカルで動かすもよし、Dockerでイメージ作って動かすもよし、まあいろいろやり方あるしその方が画像解像度も高くできるので一番良いと思います。

やってみた

beautiful anime wallpaler xxxxxxxxx
beautiful cathedral photograph like San Pietro Cathedral
middle aged man photograph who is crying, and eating noodle

3枚目の「泣きながらラーメンを食べる中年男性」は麺だけで汁も具も無いし手で食べてるし、この辺りは汁や具を付けたり箸を使わせたり細かいコマンドを入れないといけない様子。

クリエイターの名前を入れて○○風の絵を描いて!と指示するのは正直ちょっと良心が咎めます。

感想

この感想が自分の中ではわりと重要で、10年後にこの記事を見た時に面白いだろうなと思って書きます。

率直な感想としては、ああこれ、高精細ないらすとやだよね、と。
1枚絵なら何度か試せば結構面白い画像が得られるので、提案資料の挿絵に使ったりとかいろいろできそう。

noteのヘッダー画像の自動生成機能とかいいんじゃないですかね運営さんw
※この記事のヘッダー画像もStable Diffusionで作りました。

a young fisherman who is riding on a big tortoise AIが考えた浦島太郎

クリエイターの仕事はなくなるのか

これは私見で、あくまで想像の範囲だけどNoだと思います。

最大の理由はAIには責任も取れなければ保証もできないということで、この役割を担うためにも(多少仕事内容は変わるけど)クリエイターの仕事は存続し続けるのでは、と思います。

クリエイターはAIを使いつつそれをベースにして自身の絵を入れていくようなミキシングは今後増えてくるのかも。
着想のヒントにAIを使って、絵自体はクリエイターが描くとか、アシスタント的な役割をAIにやらせるとか。
現時点では同じ絵柄であと5カットみたいな使い方はできないっぽいですが、これは今後改良されたらできそうな予感。

あとやっぱり案の定というか、呪文を唱えるにはある程度の練習が必要で、自分の欲しいものを正確にAIに伝える技術みたいなものが必要になってきます。
ノーコードが普及すればプログラマーの仕事がなくなるわけではなく、ノーコード職人の仕事ができて、結局それをやっているのはプログラマー、みたいな。

人間がAIを使うことに対し一番のハードルとなりそうなのが、「なんやかんやいい感じにやっておいて」のなんやかんやいい感じを解釈することなので、そこに対して人間が(責任を取る意味でも)間に入るというのが現実的な落とし所かなと。
あと自分が欲しい物が分かっていない人も相当数いるので、それを探る役割もまだまだ人間が担うところかもしれません。

ああでも、ポンチ絵をちゃんとした絵に仕上げる機能なんてのもありますね。

永野デザインの如く、ツインアイが瞳になっているガンダムが誕生した

これはHuggingFace内で試したもの。

まあ機械化によって失われる仕事というのは、安値を売りにしているような業種であって、例えば大量生産の手工業も機械が導入されることによって仕事がなくなるような感じで、安価にイラスト作成を請け負っている方が一番割を食うことになるんだろうなと思います。

悲惨なのはこれから発展しようとしているような国、地域だと思っていて、人件費の安さを売りに海外から仕事を受注しようにも既にAIに仕事を奪われていると。なのでかつての日本や中国が取っていた成長戦略を取ることができないのではと。想像ですけど。

来てほしい未来

で、ですね
このStable Diffusionを始めお絵かきAIを見ていて思ったんですよ。

これの3DCG版が出たら、メタバースとかXR業界の敷居が一気に下がりそうだな、と。
もう既にあったりして。

3DCGを作るのって現状結構な手間がかかっていて、2次元ならカメラでパシャっと撮ったりペイントソフトでひょいひょいと書けば画像が得られるのに3次元になるとそうもいかないわけでして。
この辺りが3DCGが高コストで、要はそれらを使うサービスや広告を打とうとした時にコスパが悪くて選択肢から外れたりするわけですけど、
これがユーザーが呪文を唱えるだけでオリキャラをポンと作って、それこそアイコンを作るが如く作ってアップして遊べるようになったら、そりゃ楽しいでしょうよ。

XR、つまりARやVRやMRといったナントカリアリティの事なんですけど、これらの普及がいまいち進まないのって、裾野が広がらないからだと思うんです。
写真ならカメラがあって、それで撮れば写真が出来上がることが皆分かっていますし、お絵かきソフトで絵を描けば画像ができる。だからたまに素人が撮った写真でとんがった素晴らしいものが出てくるのは大量の人が画像を作ることで裾野が広がっているからなんです。

同様に3DCGも、裾野が思いっきり広がれば頂上も高くなるので、今はコスパ的に合わないARキャンペーンやVRイベントなんかも今後復権してくるのでは、と思います。

そんなAIができればマークもずっと男前になると思う。

さてさて、どうなりますかね。
答え合わせは10年後に。
未来が楽しみです。


この記事が気に入ったらサポートをしてみませんか?