見出し画像

AIGC:COLOR EXHIBITION(August)投稿作品の作成過程解説【StableDiffusion】


1.AIGC:COLOR EXHIBITION(Aagust)

先月に引き続き開催されました。今月のテーマは「GOLD」でした。

当日の参加者による作品は運営アカウントから順次投稿されました。
Twitter(X)上で以下で検索すると探しやすいと思います。

from:@aigcinfo until:2023-08-27

2.今回の投稿画像(8/26)

 私からは今回は以下の画像を提出しました。
(もしかしたら読み込みに少し時間かかるかもしれません。その場合は少々お待ちいただくか、画像部分をクリックするとご覧になれると思います。これでも実際の画像より少し画質を落としています…)

The Tower of Golden Lives

かなり縦長の画像にしてみました。
サイズは横3,072×縦16,224です。

テーマのGoldを全面に入れつつ、5階層に分かれています。
各階層には人物(Girl)とともに、生物モチーフのオブジェクトがあります。
各階層を上から、龍、猫、鳥、狼、蝶となっています。

3.最初の想定イメージ:クリムト風

元々作ろうと思っていたのは、上記の画像とは違う方向性のものでした。
テーマGoldとなりまずイメージしたのは、グスタフ・クリムトの絵でした。

クリムトについては以下が参考になります。

また以下はクリムトの絵の特徴をChatGPTにまとめてもらったものです。

グスタフ・クリムトの絵画は以下のような特徴があります:
豊富な装飾
クリムトの作品は、ビザンティンモザイクの影響を受けて、細部まで装飾されています。これにはり金箔を使用した、色鮮やかな模様を描いたりすることが含まれます。

主題
クリムトは女性の肖像を頻繁に描きました。また、彼の作品には、官能的かつエロティックなテーマがしばしば含まれています。

シンボリズム
クリムトは象徴主義者として知られています。彼の作品は、抽象的なアイデアや概念を表現するための象徴的な要素を多用します。

スタイル
クリムトの初期のスタイルはリアリズムに傾きましたが、彼のキャリアが進むにつれて、より装飾的で象徴主義的なスタイルに移行しました。これは「黄金時代」などと呼ばれる期間に最も明らかです。

パターンと色彩
彼の作品には鮮やかな色彩と複雑なパターンが特徴的です。彼はしばしば幾何学的な形状や細かい装飾を背景や衣装に使用しました。

以上の要素が融合して、クリムトの独特な芸術スタイルが形成されています。

クリムトの作風をイメージした習作をいくつかここに掲載(供養)します。

さらにクリムトの作品としてイメージしていたのは
「ベートーヴェン・フリーズ」
という作品です。
これは現物は壁画となっており、横長の壁に様々なモチーフが描かれ、また前述した象徴的・抽象的な特徴もよく表れている作品です。
この作品については以下が参考になると思います。

このイメージから、今回の投稿作では(Twitter・Xの投稿向けとして)縦長の画像にできないかと考えていました。
※以前、クリムト展でレプリカを見たことがあり、印象深い作品でした。

その他にも、特に有名な作品である「接吻」や、「女性の三時代」「ユディト」「アデーレ・ロッホ=バウアーの肖像Ⅰ」などの金を用いた作風もイメージしていました。

なお、生成に当たってはControlNetのTileも使用しています。
元画像はibisPaintというアプリで、金や黒背景、装飾が入ってほしい部分を指定するような画像を自作しています。

また途中から、前回と異なる試みとして同じくControlNetのOpenPoseも使用しました。
拡張機能のOpenPoseEditorを使用してとってほしいポーズを作成し、MultiControlNetにて入れました。

ただそれでも、イメージしている金の部分が抽象的な形なので、なかなか思った通りにならず、苦戦していました。

4.モチーフ変更

いまいちピンと来ない中、モチーフ変更を思いついたきっかけは以下の2枚でした。

1枚目では、鳥(の頭部。首から上?)が偶然出てきました。
偶然とは言っても、Tileで入れた画像ではこの形を作っており、特になんのモチーフということではなく抽象的な金の彫刻を入れる想定でした。

また2枚目では、中央から上部にかけての金の装飾がなんとなく犬・狼に見えました。これもTile用の画像が効いてそうなのですが、この部分は黒い背景部分の想定でした。しかしTile画像とプロンプトとが相まって、周囲よりも暗めの金の装飾として生成されました。

この2枚きっかけで、他にも金の生物を作ってみようと考えました。
そのため残りの3枚(猫・蝶・龍)は最初から意図的に作った形となります。

5.各部分の修正

(1)鳥:中央

ここはほぼ元の画像のままですが、左手だけ変だったのでinpaintで修正しました。

左:修正前 → 右:修正後

(2)狼:中央下側

ここは狼(犬ではない)に見えるだけだったので、しっかり狼の顔になるようにここもinpaintで修正しました。
いい感じに浮かび上がって、目つきに不気味さも出ました。

左:修正前 → 右:修正後

(3)猫:中央上側

猫の修正前後の画像はこちらです。

左:修正前 → 右:修正後

猫部分の主な修正点は、手・腕・左下の猫です。
明らかに右手が2個あるので、下側の方をinpaintで消しました。また消した腕の延長線上も変なので同時に修正しています。

また左下の猫は、生身っぽかったので、金になってもらいました。毛並みもちょっと逆立っていい感じになりました。

(4)蝶:最下段

蝶の修正前後の画像はこちらです。

上:修正前 → 下:修正後

こちらは手・顔・髪形を修正しました。
左手ももう1本指が見えてもいいかなと思いましたが、あまりいい修正結果が得られなかったのであまり変えませんでした。

髪形は、実は元の生成時にいろいろ変えるのを忘れてしまっており…。
ここで少し動きをつけるようにしました。

(5)龍:最上段

蝶の修正前後の画像はこちらです。

上:修正前 → 下:修正後

こちらの修正点は顔と左手です。
形の修正+龍を従えてる感じにしました。
右の龍の口が異形ですが、これはこれでありだなと思い、そのままにしました。

6.完成まで(合成・サイズ調整)

出来上がった各部分を、Photoshopで合成しました。
合成時には、間を300pxほど空けて配置し、その間をGenerativeFill(生成塗りつぶし)の機能を使い隙間のつなぎを生成しました。

また、中央の3枚は左右両側に256pxずつ拡張し、そこも再生成しました。さらに最上段、最下段の2枚も、各上下に256pxずつ拡張・生成しました。

その上で全体のバランスを見て、つなぎ目や細部を若干修正しました。
そして、最後に全体のサイズを2倍に拡張し、ロゴを追加して完成となっています。

7.おわりに(感想・お願い・次回予告)

今回は、抽象的な金の彫刻や背景をイメージ通りに作ることにかなり苦戦しました。抽象的なものをTileやプロンプトで指定することは難しいですね。(単に技術・知識不足かもしれませんが)
基本的に思った通りにならないので、途中からCFG Scaleを5.5~6にすることであえて結果をばらけさせて、いい感じの抽象的オブジェクトができないかと思い生成していました。
その一方で、人物の配置・ポーズはイメージから逸れないようOpenPoseEditorを使用して生成結果の散らばりを抑えました。
さらに生物モチーフも取り入れることで、抽象と具象を織り交ぜた画像を作ることができました。


<皆様へのお願い!>
ほぼ趣味で(※)やっているとはいえ、生成環境の維持費用(私の場合は主にColab利用料)が馬鹿にできなくなってきました。
(※仕事でも生成AI関連に関わるので、その勉強も兼ねて始めました)
もしよろしければ、本ページ下部の「気に入ったらサポート」からご支援をお願いいたします!


そして次回のCOLOR EXHIBITIONは9/30です!

(おまけ1)その他候補作画像

候補作となったもののいくつかを追加で掲載(供養)します。

(おまけ2)OpenPoseEditor画像

各画像用に作成したopen poseの画像です。

記事内容やX(Twitter)等での投稿画像を気に入っていただけましたら、よろしければサポートお願いします! いただいたサポートは生成環境の維持費に使わせていただきます!