見出し画像

Stable Diffusion 夢の機械(画像生成AI)について-29

About Stable Diffusion Dream Machine (Image Generation AI)-29

 言葉でAIに指示を出す。「花束を持った女性」。AIモデルや描画方法の種類によって、描かれる図像は様々だ。
 どのような服を着て、どこにいて、どんな顔をしているのか、葬儀なのか結婚式なのか、誕生日なのか、買い物帰りなのか、ありとあらゆる考えられる状況を、召喚用のプロンプト呪文として用意する。光の強さ、色、雰囲気、小物、靴、等々。事細かな指示用の文言は「呪文」だとはよく言ったものではある。
 陶芸で最後に窯に火を入れた後、器の色彩が窯変するように、stable diffusionでもAIモデルデータと呪文の組み合わせを数限りなく何回も試行し、最終的に「これでOK」となった時点でも、やはり最終出力での窯変は不可避だ。ここが偶然性を考慮しなければならない箇所で、徹底的に呪文を細目化しても、やはり完全に何か予測した物と同一画像を出力するのは難しいだろう。
 こちらで意図したものを超えた、もしくは的外れなものが出力されることもstable diffusionの面白いところである。
 どのように偶然性を考えるか、という行程も、生成画像AIの楽しい部分だと思う。この「避けられない偶然性」といった画像AIの特徴が、怪談の入り込む余地もあり、念写にも通ずる、感興を呼び起こす点だと私は思う。

2024年1月に生成編集 Generated and edited in January 2024

 Words are used to give instructions to the AI for the generated image. "A woman with a bouquet of flowers". Depending on the AI model and the drawing method, the image drawn will vary.
 What kind of clothes, where she is, what she looks like, whether it is a funeral, a wedding, a birthday, a shopping trip, or any other possible situation, are prepared as prompt spells for the summoning. Light intensity, color, atmosphere, accessories, shoes, etc. It is often said that detailed instructions are "spells".
 Just as the color of a ceramic vessel will change after the kiln is fired for the final time, so too, with stable diffusion, the combination of AI model data and spells is tried countless times, and even when the final "OK" is reached, kiln changes are inevitable in the final output. This is the point where coincidence must be taken into account. Even if the spells are thoroughly refined, it will still be difficult to output an image that is completely identical to something predicted.
 The fact that the output may be beyond or off the mark from what we intended is one of the interesting aspects of stable diffusion.
 The process of how to consider coincidences is also a fun part of generated image AI. I think that this characteristic of image AI, such as "inevitable coincidence," is a point that evokes a sense of excitement, which is similar to psychic photography, and also has room for ghost stories.

この記事が気に入ったらサポートをしてみませんか?