見出し画像

なぜ『無題』なのか

・前書き

 こんにちは。こんばんは。
 水色の焦土です。

 note を開設してからというもの、「別にそんなに書くことも無いだろうしなぁ」と見切り発車したにも関わらず、お陰様で書くことが尽きず毎日更新できております。

 新機能や気になったことなどが検証しやすく、やろうと思って始めればやれてしまうのが良いですね。機能の機序を把握していなくても、試行回数を重ねるのが容易なので、強引に検証結果を結論付けられてしまうのが良さであり、怖さでもあるなとも思っております。

 仕組みを理解していないと本来的にその機能がどう働き、どう結果に結び付いているのか間違って判断してしまいそうですし、それが変に噛み合ってしまうと、ずっと勘違いし続けてしまうのだろうなぁと思いながらも、まぁ困ってないし良いか! という感じもあり、気になったら即検証! くらいのスタンスでも良いのかもしれないとも思っております。無限に時間があったら最高ですよね……。

 しかし今回はそう言った検証は無しにして、わたしのAIイラストに対してのスタンスみたいなものを書いていこうと思います。最初の記事であらかたは書いたのですが、もうちょっと深いところを書いていければ良いなと思っております。

 それではどうぞ。


・ChatGPTに吐き出させたプロンプトを stable diffusion に描かせる意義とは

 プロンプト術の記事にも書いたのですが、わたしは ChatGPT に吐き出させたプロンプトを総当たりさせて生成物を吐き出させています。

 そもそものスタンスなのですが、わたしは AI イラストを「わたしが行うクリエイティブな行為」だとはあまり考えていません。

 AI絵師だとか、AI術師だとかAI術士だとか、肩書きにこだわるタイプの方が沢山いるようで結構驚いているのですが、わたしは、クリエイティブとは自分が実際に手を動かして創作物を創り上げるものだと考えておりますので、この生成行為がそれに該当するとはあまり実感として得られていません。

 マージモデルを自作したり、プロンプトを試行錯誤したり、LoRA の自作に取り組んだり数ある LoRA を選んだり、というのは確かにクリエイティブに寄与する行為や、それに準ずる行為だとは思います。AIイラストという概念について、実際に触っているひとと敢えて避けているひとの認識の違いとして、「AIイラストはなんかそれっぽい単語を入れるだけで数秒で思い通りのイラストが作れる」というものがあるかとは思いますが、そうではないことは、取り組んでみればすぐにわかることかとは思います(あまり社会派なことは発信したくないので、これ以上この話題は掘り下げません)。

 ですが、だからといってクリエイティブだと断言するには疑問が残ります。散々論じられていることだとは思いますが。

 AIイラスト生成者が行うそれらの行為は、要するに、画材選びをしているだけに留まっているような気がしています。

 または発注者や編集者やプロデューサー業のような、レイヤーが1つ上の視点と言いますか。

 スポンサーの要件をおおよそのかたちにしたプロデューサーやデュレクターが、現場作業者に渡す仕様書のような。それは恐らくクリエイティブに違いないのでしょうが、わたしも創作行為に没頭していた時期がありますので、肌感覚として、実際に手を動かさないそれらがクリエイティブなのか? という問いはずっと考えていたことでもあります。それは間違い無くクリエイティブなのですが、じゃあクリエイターか? というと、いやプロデューサーやん……となると思われます(その線引きに実際的な意味があるかどうかは置いておくとして)。

 AIイラスト生成者はプロデューサー的な立場ですよね。t2i ポン出しをメインにしているなら、よりその様相は強くなると思います。

 わたしが行っているのは、要するにその最後の砦である仕様書までも外注している行為に他なりません。

 これは客観的に見て、まったくクリエイティブではありません。

 お前は何か描かせたいものがあって、AIにイラストを吐き出させているのではないのか? それすら無いのに、何を原動力に毎日毎日 GPU を発熱させて部屋の温度を爆上げしているのか?

 これは自己紹介記事でも書いたことですが、

ここではないどこかに存在する/存在しない光景を表現したい

水色の焦土とは

 です。

 逆に、わたしはとてもすごいと思うのです。

 コンセプトをしっかり決めて、描きたい場所やひとやシチュエーションが沢山あって、そのために爆速でおおよそイメージ通りのものが出てくるAIイラストに取り組めることが、純粋にすごいと思います。

 アイデアの枯渇に怯えながらするクリエイティブ/プロデュース行為が、わたしは怖くてたまりません。

 なかなか思い通りのものが出てこないAIイラストに取り組み続ける根気が、わたしにはありません。

 そういう感じで、そもそもの動機が違うわけですが、わたしは「わたしが見たことのない景色」が欲しいのであって、だから人物を取り巻く景色や世界や世界観を外注することに何ら抵抗はありません。

 なぜなら、あなたが見たことの無い景色を、あなたは想像できますか?

 想像したものは、あなたが見た/視た景色です。

 たまに実行できるひとがいるのですが、わたしはそんな天才ではありませんし、自分にそれができるとも思っておりません。

 わたしが見たことの無いイメージは、当然、わたしの脳内には存在しません。

 だからわたしはChatGPTから曖昧な風景、雰囲気プロンプトを吐き出させ、それを補助するためのプロンプト構築をしています。


・わたしが見たことのない景色とは

 なんなんでしょうねぇ……。

 ともあれ、そういう憧憬がずっとあります。

 人工的な、建築物的なものも好きですが、最近はもっぱらファンタジー系の景色に傾倒しています。

 例えばサイバーパンク的な風景は見栄えも良いですし発色が良いので、AIイラストで映える景色を考えると、割と早い段階で候補に挙がると思います。サムネも盛れてイイ感じですよね。

 ですが、サイバーパンク的な生成物を何枚か出力させるとすぐにわかることなのですが、AIはその街や都市の構造を考えて出力しているわけではありません。わたしやあなたが指定した画面サイズを元ノイズを使って効率良く埋めるためにプロンプトの指示通りに出力しているだけで、それ以上でもそれ以下でもありません。なので出力されるものは大方似通ってきます。

 道があって、その脇に聳える高層建築群とネオン看板。地面には申し訳程度の群衆がいて、その中心にはサイバーパンク世界に相応しい服装にアレンジされた指定キャラが立ちます。上下アングルで雰囲気は多少変わりますが、概ねその要素の中での微細な変化になります。それ以上のものは100回程度の試行回数ではなかなか出てきません。

およそ一般的なサイバーパンク生成物の例

 ですので、都市を舞台にした生成物は、現状のAIやモデルでは上手く出しにくいのではないかと思っております。都市を舞台にすると自由度が格段に下がります。わたしは当初、それら「都市」や「廃墟」をモチーフにした生成物を好んで出力させていたのですが、そういった理由で最近はあまり出力させなくなってきました。

懐かしいあの日の生成物 その1
懐かしいあの日の生成物 その2
懐かしいあの日の生成物 その3
懐かしいあの日の生成物 その4

 改めて見返すと色々な感情が想起されてきてノスタルジックな気持ちになってきますが(たかだか1ヶ月くらい前のことなのに……)、こういったモチーフが好きでした。これは特に t2i ポン出しにしてはなかなか良い構図な気がしています。しかしなかなか出ませんので、シード値ガチャがどんどんしんどくなってきます……。人物と背景をバランス良く、好みな感じに出力させるのは単純に試行回数とシード値に依存してしまいます。ファンタジー世界観が特別珍しいものを出力させやすいわけではありませんが、ビジュアル的に飽きが来にくいものになりやすい気がしています。単純な好みの問題もあるとは思いますが。

懐かしいあの日の生成物 その5
懐かしいあの日の生成物 その6
懐かしいあの日の生成物 その7
懐かしいあの日の生成物 その8

 この辺りから本格的にChatGPTに頼り出した感じがありますね。

 世界観主体(この世界観に、このキャラを置きたい)から、キャラ主体(このキャラを、色々な世界観に置きたい)に変わってきた感じです(ここではLoRAを活用できていないので、キャラ指定をしていてもキャラが出現していないことが多いです)(マージモデルの意図や方向性もハッキリしてきて、描かせたいものやフォーカスしたいものを描かせるためのマージに成功し始めた頃合いでもあります)。

 わたしは自分の発想の貧困さと、言うことを聞かないAIに悩むのをやめました。

 なぜなら、ChatGPT はかなりの精度でわたしが stable diffusion に描かせたいものの方向性に沿ったプロンプトを吐き出してくれます。その方向性と意図がわかっているなら、最悪そのプロンプトを自分で再アレンジしても良いわけです。自分で組み立てる場合でも、どういった要素が雰囲気の構築に役立つのか、何となくわかってきます。本当に意味が無いプロンプトというものもそうそう無いものです。

 この頃からAIイラスト生成が劇的に楽しくなり始めました。

 見たことのない景色は案外すぐ手が届く場所にあり、わたしはそれを得るための手段を得ました。それは、しかし簡単なことではありませんが、貧弱な自分の脳みそからそれを捻り出さなくても良いとわかった以上、あとは試行回数と最適なマージモデルがそれを叶えてくれるでしょう。

 人間が短期間で思い付けるアイデアの数などたかが知れており、その優先度は数をこなせばどんどん下がっていくわけですから(一番やりたいものを最初に叶えますよね)、モチベを維持しなきゃ! 何かを生み出さなきゃ! みたいなのが一番オモロじゃないですからね。

 わたしはこういった心持ちでAIイラスト生成を行っております。


・なぜ『無題』なのか

 わたしは生成物をちちぷい様に投稿していますが、その生成物にタイトルを付けたこともキャプションでそれについて説明したこともありません。

「水色の焦土の『無題』見た?」

「どれ???」

 となっていて不便かもしれませんが(なってはいないでしょう)、わたしは作品タイトルを付けるのがとても苦手です。

 ……以上なのですが、それ以外の理由も多少はあります。

 というのも、前述した通り、わたしはわたしの意図で生成物を生成していません。……いや、意図はあるのですが、その生成物に至った直接的な意図はわたしの中にはありません。

 こう、わたしの好みの問題なのですが、タイトルやキャプションで意図を再付与する行為が、あまり美しくないような気がしています。

 まず生成者の意図があり、それを AI が出力し、そこに摺り合わせてタイトルやキャプションを生成者が付ける過程が、どんどん当初の意図から乖離していくようで、言ったもの勝ちみたいな雰囲気を感じます。

 わたしはそれがとても苦手です。そもそもイラスト生成 AI は意図を出力しませんので当然と言えば当然なのですが、やはりまだ生成物に正確な意図を付与して生み出すのは難しい気がしています。

 それは表情であり、ポージングであり、服装であり、背景であり、キャラが画面上に配置される位置です。

 例えばポージングであるなら、作者の意図は指先の角度一つにさえ宿るはずです。表情であるなら、口角や眉のミリ単位の角度にさえ宿るはずです。

 それを制御できないのであれば、やはりそこに意図は生まれません。

 指の描写で困っている現状、意図など生まれるはずが無いでしょう。

 それを強引に付与する行為が、わたしは作品にとって( AI 生成イラストは作品なのか?)不誠実な行為だと思わざるを得ないのです。

 創作者とは、創作物への奉仕者です。

 創作物への奉仕が疎かになるようであれば、それが創作物への奉仕に成り得ないなら、この生成物に付けるべきタイトルは「無題」以外に有り得ないと思ったのです。

 ……ということで如何でしょうか?

 あまりにも無茶な屁理屈に読者諸兄も呆れ果てているでしょう……。

 タイトル、考えるのむずかしいですよね(むずかしいね)。


・後書き

 ということです。

 こんなわたしですが、一応、生成物のコンセプトといったものは存在しますし、考えております。

 まったくの偶然で生まれたこの生成物ですが、これがわたしの意図を反映してくれたような気がして( AI はわたしの意図を汲み取りませんので)、わたしはとても驚きました。


 とても陳腐かもしれませんが、そういうことです。

 以上です。


この記事が気に入ったらサポートをしてみませんか?