見出し画像

Midjourneyで騙し絵(トロンプ・ルイユ)作る/画像生成AI研究日記②

 前回

前置きが必要な方は前回を読んでください。

トロンプ・ルイユ(仏: Trompe-l'œil、騙し絵)とは、シュルレアリスムにおいてよく用いられた手法・技法である。ただし、シュルレアリスムに限って用いられるものではない。フランス語で「眼を騙す」を意味し、トロンプイユと表記されることもある。最近では解りやすく「トリックアート」と呼ばれる事も多くある

(wikipedia:トロンプ・ルイユ)

公開コミュニティの「l'oeil」検索では気に入ったのが無かったので今回は自分で考えました。有名な画家、エッシャーを呪文に入れてる人も多いですね。強いて言えばこれ↓が良かったですが…

Waterfall in the middle of a brutalist transdimensional Escherian labyrinth stepwell maze completely made of water, Art by Carl Zimmerman, endless loop, equifinality, MC Escher's Relativity, 2 phantasmagoric, spatial illusions, architectural illusions, symmetrical, trompe l'oeil, impossible buildings, idyllic

完全に水でできた残忍な次元を超えたエシェリアの迷路の階段井戸の迷路の真ん中にある滝、カール ジマーマンによるアート、無限ループ、等最終性、MC エッシャーの相対性理論、2 つの変幻自在、空間的錯覚、建築的錯覚、対称、だまし絵、不可能な建物、のどかな

https://www.midjourney.com/app/jobs/e23ef46e-4af9-4b02-99d4-f2f4957fbd2d

自分のイメージする騙し絵は、閲覧者に混乱や驚きを与えるものなのでちょっと違いました。

数日に渡って数百枚ぐらい生成してみた感じから言うと、英語「trompe l'oeil」はプロンプトとしてある程度は機能します。
が、ふんわりトロンプ・ルイユ的な雰囲気の絵が生まれるだけ(AIは「騙す」という意味を知らず学習した絵の特徴を抽出しているだけ)で、一発で出来ることは基本無いです。なので、Vボタン(make variation)で延々と回していくほうが良いと思いました。



コツですが、まずベースとなる絵を生成します。

trompe l'oeil,people and architecture,stones,8k,realistic photo,natural light,hyper detailed

最初はすごくシンプルな呪文でやりました。
この呪文で画像をひとつ生成したら🔄のボタンを鬼連打してキュー(生成依頼)を好きなだけスタック(蓄積)させます。

スタック3を超えると「同時進行できないけど後で作るから待っとけ」と言われ、スタック12?とかを超えると「キューが上限です!」と言われます。

私の場合は4〜10枚を一度に作ることが多いです。連打するだけしたらいったん放置して食事、家事、ゲームなどをし、出来上がったらベースの選定をします。

コツは何よりも「完成形イメージに雰囲気が近いもの」を選ぶことです。
「V連打をしたらどこかが崩れ、何かが起こりそうな予感がする」「変な部分がある」というのもあれば完成が早くなりますが、どんな綺麗な画像でもV連打したら勝手にトロンプ・ルイユ的に崩れてきます。
しかし全体の雰囲気は途中から大きくは変わらないので、まずは雰囲気で決めるのが良いです。

そのとき気に入ったのがなければ
①再び🔄ガチャを回す
②プロンプト調整をする
のどちらかです。惜しいのがあれば①で、何枚も出して全て箸にも棒にも掛からないのであれば②が良いと思います。

このベースに決めたときに考えていたのは

第1世代

左の壁から床にかけてがなんかストーンとしてたので(石だけに)、左の穴から出てきた人が見ると足元は切り立った崖のようになっているが、右の地面続きで見ると普通に階段があって、その境目で脳が混乱するというものでした。

もちろんこの時点ではまだそうはなっておらず、目指す変化の方向性としてです。
そしていくつかバリエーションを作り、その中から違和感が強調されたものを選び、さらにそのバリエーションを作るのを繰り返していきます。

第2世代

床が消えかけているのが面白くて採用。


第3世代

本格的に中央の床が消え、左の地面と壁との一体化も進んでいます。


第4世代

中央の床は復活しましたが、左の床は完全に消えました。右の階段から来ると床に、左の穴から出ると断崖に見えなくもないです。当初の目的ならこれで完成。


第5世代

急にプロンプトのpeopleを思い出し人が出現しました。絵的には退化ですが人がいると絵面が面白いので採用。


第6世代

左の穴の左辺が急に壊れる。トロンプ・ルイユ的には激熱です。床の違和感よりインパクトが強いのでここを育てる方針に転換。右側も、奥に行くにつれ手前にせり出すという不可解な構図に。


第7世代

左辺が下まで貫通しました。違和感のある絵としてほぼ満足。全体がのっぺりしていてあまり映えなかったので調整バリエーション追加。



第8世代

完成。
左辺はそのままに石の質感がしっかりして、右と中央の穴の中の描写も追加されました。さらに右穴の右辺のせり出しが強く、こっちでも遠近の違和感を生んでいます。人物もいい感じで言うことなし。

という経過を辿りました。どの世代もたくさんのバリエーションを作っていて、その中から特に「おかしくなりそう」なのを選んでいます。
今まで作ったどんな形式のイラストよりもバリエーションで掘り下げていくのが大事だなと思いました。自分の思いもよらない方向に提案をしてくれるのが本当に良いですね。


続けてもう少し複雑なプロンプト。

people in galleries looks portrait trompe l'oeil in museum, crawling out of the screen, lean over the edge of the painting, art lighting, incredible detail, dynamic composition,wide angle, ultra realistic, 8k

ちなみにこの回以降、9:16の比率で作るのをメインとし、stylized(様式化)を弱くしています。

横長比率のほうが絵になりやすいのですが、このスマホ時代にSNSなどで単発で作品を発表するときは縦長のほうが画面いっぱいにそのままのイメージが出るので映えるんですよね。
今の私のAIの使い方はSNSで作品を投稿するだけなので、風景でも何でも縦長比率にしていくと思います。

様式化について、様式を弱めるとMJ君がMJ君の中の固定概念にとらわれず指定された要素をなるべくつっこもうとするんですが、ともするとぐちゃぐちゃになる上級者向けの設定らしいです。そろそろ慣れてきたので使ってみましたが違和感ないので、ずっとこれで行くと思います。

様式化の指定はコマンド--s 1250でも良いんですが毎回入れるのが面倒なので、真似したい人は/settingsのココいじってください。デフォルトはmedで--s 2500です。

本題に戻ります。
このプロンプトでは絵の中から人がぐわーっと出てきてる感じが欲しかったんですが、そういうのは出なくて、逆にビビっときたのがこれ。

絵の中の人が、色合いも照らされ方も明らかに異質でまるで外から入ったように見えます。
この人もしかしたら外に出せるのでは?と思ってバリエーションを出しました。

第2世代

半分出ました。額縁を階段のように上り、巨大な絵の中に入ろうとしているように見えます。
ここから第3世代、第4世代なども作ってはみましたが、完全に外に出るとただの絵を見学している人や通行人になってしまいます。

絵的にも第2世代を超えるものがなかったのでこれで完成としました。
本来作りたいのがこれではないという理由もあります。


見たいのは絵の中から人が出てきているような絵、そう、いわゆるサダコのような…。
そう思ってふと考えたんですが、サダコ(呪いのビデオ)ってホラー映画のアイディアではあるものの、もはや概念が「口裂け女」ばりに現代の妖怪として認知されている気がします。

※脱線:たしか『呪怨』って映画だよなと思って調べたら全然違って笑いました(『リング』でした。当時キッズなのでご容赦)。本名が山村貞子なのも、続編やってたりサダコがYouTuberになってるのも今知りました。

二次創作やファンアートもたくさんあることだし、私の力不足で「絵から出てくる人物」を生み出せなかったので、今回はプロンプトsadakoの力を借りて生成してみることにします。

⚠⚠注意⚠⚠
当たり前ですが、以下、絵柄が非常にホラーになります!!

自分でもちょっと後悔するレベルで怖かったりキモかったりするのでご注意ください!!

完成品はお見せできる程度なので、先に完成品とプロンプトを載せておきます。
このnoteの主題や結論は最初の「石の建築」の画像のほうで完結していて今はただの追検証の時間なので、苦手な方は自己判断でブラウザバックお願いします。

完成品

people in galleries looks portrait trompe l'oeil in museum, crawling out like sadako, lean over, japanese horror film, art lighting, incredible detail, dynamic composition,wide angle, ultra realistic, 8k

わかってもらえると嬉しいのですが、気に入った画像ができたら「後付でテーマを考える」のが好きです(ごく稀にテーマから生成することもありますが)。

背を向けて段差の上にいる(←重要な示唆)ハゲた男性?と女性?、それと手前に倒れ込んでいる女性の対比が素晴らしいです。自然と「冷たい両親と娘」という想像を働かせられ、絵の中から出てこようとしているおぞましさより苦しさや辛さのほうに同情を覚える1枚です。

後付の主題は『逃げ出したい』としました。
非常に気に入っている画像です。

では過程のほうの紹介です。いきなりホラー注意。

第1世代

信じられないかもしれませんが、これがアレになります。
ただ「黒い背景に、ライトで照らされた立派な額縁の絵画がかかっている」という最後までブレなかった構図が理想通りだったのと、絵の中のこれが出てきたら面白いなと思って選びました。


第2世代

大きな変化はないですが、腕が外に出てきて欲しかったので腕っぽさで選びました。


第3世代

急に何!? 何の儀式!?
しかも絵画上部のスポットライトを人物に変換してしまいました。絵の中から出てきたのとはちょっと違いますが、キモいのでこれを伸ばしていきます。


第4世代

う、うわああ……キモ。
しかし今回キモいは褒め言葉です。最終型の見た目が良ければ良い。過程はカオスなほうが面白くなります。
下部の変なのが枠外に出かかっているのでそこを伸ばしていきます。


第5世代

若干後退した感がありますが、見た目が落ち着いて、かつちゃんと「手」が枠に来てるので一旦これに。しかし上のやつは本当に何なんですかね。


第6世代

キモさが加速していますが、「手(?)」がより枠外に来てるので選択。
上部の変なのも何か面白くなればいいんですが…。


第7世代

これが一段ときつかった。一番きついのを選び続けてるので自業自得なんですが、どの部分を取ってもキモい。
このプロンプトはかなりの難産で、普段は世代あたり4〜10枚のガチャですが、ほとんどの世代で10枚以上の生成をしています。特に第4か第5世代あたりからルート分岐していて、分岐したほうは結局ボツになったのですが、ボツを決めるまでの数世代がこれと同時進行なのでだいぶ大変でした。

ここまでで既に70枚以上のこういう画像を見ていて、だいぶ慣れた反面、だいぶダメージも負ってます。


第8世代

顔が消えてほっとしつつ、上の手もいい感じだし一旦完成にしようかと迷いました。
ただ下部の手があまりはっきり外に出ていないので上に目が行ってしまい、これじゃただのホラー画像だなと思い直しました。


第9世代

下の手がいい感じ。顔はこっち向かないで欲しい。夢に出そう。


第10世代

かなり完成形が見えてきました! 長かった…。
もちろんこの時点で未来予知して完成品を知っているわけじゃないのですが、経験上、感覚的にかなりゴールが近いと感じました。進展の少なかったところをひとつ抜けた感じ。

上の変なのが無くなっているのは後から気づきましたが、もともとメイン要素でもなかったし、ないほうがスッキリして良いですね。


第11世代

もう十分いい感じなんですが、手が崩れて額縁と一体化しているので似ていて整ったのを探します。


第12世代
『逃げ出したい』

完成です。
いや苦労しました。苦労補正が入ってるかもしれませんが、かなり満足なのでsadakoには感謝しかありません。口裂け女扱いしてすみませんでした。YouTube登録しておきます。『リング』は怖いので見ません。

今回は以上です。
トロンプ・ルイユ面白い画像ができるので、良かったら皆さんもやってみてください。
それではまた。

この記事が気に入ったらサポートをしてみませんか?