AIで画像生成したら『人類vs.AI』の意味を理解した…気がする

yoshino

2024年5月13日 11:47

画像生成AI歴=2週間の私が、キャリアが浅いからこそ気付いた「画像生成AIとの付き合い方」について語るシリーズ（最初で最後）。

ここんとこ、過去10日くらいの間に、いくつか画像生成AIについてのnote投稿をしました。例えば以下の記事。

📝 見出し画像がないなら、画像生成AIで作ればいいじゃない
📝 画像の「ない」部分を自動で生成する「Uncrop」を試してみた
📝 生成AI：画像にブツを描き足す「Generative Fill」レビュー

また、画像生成AIを使った遊びとして下記の作品（？）があります。
よろしければ見てみてね。
ちなみに、現在は主に「DALL·E 3」を利用しています。

画像生成AIは「万能な絵描き」ではない

簡単なプロンプト（命令・指示の文章）で、素晴らしく高品質な画像を、短時間で生成してくれる性能は、目を見張るものがあります。

しかし・・多くの場合、人間の言うことをあまり聞いてくれません。
つまり、指示した通りには描いてくれないことが多い。

指示が具体的じゃないから、という理由はもちろんあります。
が、具体的に言えば言うほど、やっぱり指示通りにはなりません。

人間がそれほど具体的なイメージを持っていなくて、細かいことは気にしない、という場合、それはそれは素晴らしい提案を出してくる場合があるんですけどね。
「○○な風景」のような指示で、あとはお任せする場合などですね。

そこに、1つ2つでも具体的なモノや人、動作などを入れ込みたい場合は、途端に「聞く耳を持たない暴れん坊」になるのが画像生成AI。

このジレンマに悩まされているユーザーは、とても多いと思います。
っていうか、ほぼ全員が経験しているはず。

なかなか思い通りにいかなくて、何度も何度もやり直し。
そんな中で、「これ！」という作品ができた時の喜び。

現在の画像生成AIユーザーは、そういう使い方が主流と思われます。

画像生成AIの利用、2つのアプローチ

いろいろと試している中で、画像生成AIの使い道のアプローチとしては、2種類あるのでは、と思っています。

それが以下の2つ。

①「人間⇒AI」
人間の思考をできるだけ正確に具現化するアプローチ

1つは、人間が思い描いたシーンやキャラクターを、できるだけディテール（詳細、細部）までプロンプトで伝え、思い通りに近い出力結果を得る方向性。

プロンプトエンジニアリングという言葉（職業、役割、スキル）があるように、AIに対して最も適切な指示を出すというのは「技術」です。

どのような指示を出せば、より正確な結果が得られるか、というのはテクニックであり、ノウハウなので、研究や試行錯誤で高めていくことができます。

人間の頭の中が主体であり、それをなるべく正解に近い形で具現化する方向のアプローチです。

②「AI⇒人間」
AIのフィードバックから発想するアプローチ

もう1つは、人間側からはあえて余白を残した状態で指示を出し、AIが導き出したアウトプットからインスピレーションを得る、という逆方向のアプローチ。

細部まで具体的に指示するのではなく、やや曖昧で簡素なプロンプトを与えて、AIの膨大な学習結果から、未知の考えを引き出します。

この場合、「思った通り」ではなく、「思った以上」または「想像の斜め上」の結果が得られる可能性が高くなります。

これこそが狙いで、思いもつかなかった突拍子もないアイデアに繋がり、思考の殻を破る効果が期待できるのです。

思い通りにいかないのを憤るのではなく、また、奇想天外な出力結果に苦笑して終わるのではなく、人間側が、いかに柔軟に「人間ではあり得ない発想」を受容できるかがポイント。

画像生成AIを使って作品を出力する時、これらの2つのアプローチのうち、「今はどちらのフェーズか」を意識することは、結構大事じゃないかなと思います。

『人類 vs AI』の意味が分かった…気がする

さて、少々お堅いことを書いてきましたが、主題の「人類 vs AI」について。

昔のSF映画や小説では、

「人工知能が自我を持ち始め、暴走する」
「人間こそが害悪と認知し、人類を駆逐しようとする」
「勝手に戦争を始めてしまい、核ミサイルのボタンを押す」

のような「暴走系」がメジャーですかね。たぶんそう思う。

しかし、実際にAIがかなり実用化され、現実の生活に溶け込んだ現在、そっち方面の脅威はだいぶ薄れているんじゃないかな。わからんけど。

それよりも、だ。

もっと身近なところで、カジュアルに「AIの脅威」に触れることができるようになったのが、画像生成AIの登場なのです。

ひとつ例を見てみましょう。

下記の画像は、上記でご紹介したほのぼの絵本「AI桃太郎」で出力された画像です。
桃太郎が、犬を家来にするため、きびだんごを与える場面ね。

採用した方の画像（左）も、大概おかしいです。
桃太郎君、犬にきびだんごじゃなくて、桃をあげてるよね。
これはまだよい。よくないけど。だんごは？
でも、ツッコミどころが明確なので、修正せずに採用しました。

問題は右の画像。
同時に出力された候補では、ちゃんときびだんごを生成しているのですが、「犬にだんごをやる」以外は、何もかもすべて間違っています。
何このかわいい犬。マルチーズ？いや犬種を聞いているんじゃなくて。
もう、どこからツッコんでいいのか分かりません。

これは恐ろしい・・😱

同じプロンプトだよ。AIの底知れぬ狂気を感じます。

じわじわと人間を精神崩壊に追い込み、いずれは廃人にしてしまおうという魂胆があるのでしょう。
あるいは腹筋崩壊で殺そうとしているのでしょうか。

AIが人間の仕事を奪うとか、AIが誤作動してインフラにダメージを与えるとか、そういうリスクが些細なことに思えてきます。

画像生成AIこそが、人類の歴史上、かつて経験したことのない人間への精神攻撃なのでは？

人類の精神力が、AIの生成する狂気の画像攻撃に耐えられるか、それとも腹筋崩壊による滅亡が先にくるのか。

行く末を見守りながら、今日もお花畑なプロンプトを与えてみるのです。

この記事が参加している募集

AIとやってみた

26,183件

この記事が気に入ったらサポートをしてみませんか？