AI画像と戯れる ④

自作のAI画像でも載せて、ぼつぼつ呟いてでもおこうかと思っていたが、偶々有用な資料に当たったのでそちらを紹介しておこう。知っている人はもう知っているのだろうが
https://note.com/matsur1/n/nb88d553ffbd6

実のところ、私が今始めているのも、どういった指示(prompt)を入れればStable Diffusionがどう反応するか、という事であり、上記の資料でかなりの部分を理解することができる。大変ありがたい資料である。

画像自動生成AI と言っても所詮はコンピューターであり、DOSの昔から、プロンプトへの入力に対応して何かを行っているだけである。
マシン語では MOV AX BX だったものが、
portrait of beautiful girl, platinum blonde hair, detailed eye and lips, by Makoto Shinkai, in the snowfall, wallpaper, trending on artstation と入力するとMatsuriさんの紹介された画像を生成するようになっただけである。

勿論コンピューターとしては高度に進化しているが、入力(prompt)に対してどう反応するかを、入力する側の人間が正確に理解していなければ予定した結果を得ることはできない。
昔からSFでよく使われる格言として「正しい答を得るためには、答の80%以上を理解してから質問しなければならない」というのがある。同じように画像生成AIとかChatGPTなどの高度に進んだコンピューターを正しく扱うのも、答のかなりを予測してから指示を出す必要があろう。

その意味で「習うより慣れろ」という古い教えがまた必要になる時代になったのかという気もする。

この記事が気に入ったらサポートをしてみませんか?