見出し画像

Midjourneyでアートの禁忌に挑んだ話 #1

はじめに

初めまして。淺間と申します。
私は普段はカルチャー変革に従事していますが、有り難いことに生成AIのハッカソンで優勝させて頂くなど、AIにどハマりしています。

皆さんは生成AI、使っていますでしょうか?
ChatGPTを始め、出力は文章に留まらず動画や音楽、3Dモデルなど、ここ数ヶ月であらゆるサービスないしモデルがリリースされています。

今回取り上げるのは画像生成AIです。
主要なところではStable DiffusionやMidjourneyが有名でしょうか?

どちらかと言うとアニメ調、イラスト調の画像をよく見かけますが、この記事では少し違った角度での実験をご紹介します。

タイパ重視の人向けまとめ

この記事では、モネの「印象・日の出」という絵画を、GPT-4とMidjourneyを駆使して「風景写真」に変換させるという実験過程を紹介しています。
当時の情景などをプロンプトとして入力することで、「恐らくこんな感じだったのでは?」というところまでは近づけたはずですが、それはモネの絵画とかけ離れたものでした。

モネが実際に見たものが仮に今回生成した写真と近しいとすれば、それをあそこまで素晴らしい絵画へと昇華させたモネという人物の創造性は、(今の)AIでは到底たどり着けないところにあるのだと思います。

「印象・日の出」という絵画

『印象・日の出』
『Impression, soleil levant』

クロード・モネの描いた『印象・日の出』という絵画をご覧になったことはありますか?
印象派という美術史における一時代を作り上げた歴史的絵画といっても過言ではない作品です。

モネはこの絵画について「ル・アーヴルで部屋の窓から描いた作品で、霧の中の太陽と、そそり立つ何本かのマストを前景に描いた」と述べています。

残念ながらこのル・アーブル港は当時から大きく様相を変えています。世界遺産に登録されるほど今なお美しい港とはいえ、モネの見た景色を人間がもう一度見ることは叶わないのです。

まずはimg2txt2imgから

Midjourneyには/describeモードというものがあり、画像を入力することで、プロンプトを吐き出すという機能があります。

そもそもMidjourneyはプロンプトを入力することで画像を出力するtxt2img(Text to Image)が主な使い方なので、それの逆が出来るということです。

印象・日の出の/describe

さっそくやってみます。
なるほど、これが「モネ」の絵であることは既に学習済みのようですね。ただし「First Evening」やら「monaco」やら、勘違いしている部分も少なくありません。

まずは、このプロンプトに「写真を出力せえ」と指示を加えて描画させてみましょう。

Prompt :
Photograph, claude monet's night sunrise over the bay of biscay, in the style of light red and light gray, impressionistic venice scenes, light orange and light emerald, rudolf hausner, théophile steinlen, sublime atmospheres, impressionist sensibilities, shot on Fujifilm Pro 400H --ar 3:2 --v 5 --q 2

残念。色合いも構図も全く違うものが出てきてしまいました。
単なるimg2txt2img(Image to Text to Image)では力不足であることが分かりました。

GPT-4の力も借りてみよう

問題点は大きく二つあります。

  1. 描画される構図(オブジェクト)が違う

  2. 色合いが違う

ということで、それぞれGPT-4に聞いてみました。
(当時Browsing機能は未開放です。)

ル・アーブル港、朝焼けと反射、漂う船と岸辺の建物 など重要なフレーズが

ついでに色合いについても聞いてみます。
ですが、提案される色味は少し極端すぎます。本来はもっと中間色が使われているはず。

ちょっと極端かも?

ということで、色はカラーピッカーの力をお借りしました。
プロンプトにはこの色と、GPT-4に教えてもらった構図を入れ込んでみます。

Prompt :
Le Havre harbor sunrise, boats and figures in the water, blurred distant shore buildings, reflected morning sunlight, sun #c76447, sky #ac8870, sea #898989, boats and passengers #203935, shore buildings #737787, Fujifilm Pro 400H shot --ar 3:2 --v 5 --q 2

ん~~~違うな!
色ももうちょっと赤っぽいはずだし、なんか建物も船も現代的すぎる!

助けてWikipedia

もうちょっと具体的に当時の情景を入力する必要がありそうです。
ということで、Wikipedia先生に頼ってみます。

19世紀後半のル・アーヴル港は国の出資により大規模な工事が行なわれていた。画面右側に描かれているのはア・ブラと呼ばれる土を掘り出すための手動式回転クレーンである。その更に後ろに描かれた3本の垂直線は、ミ=マレ船渠に停泊する船のマストである。船渠は1872年当時は完成したばかりであり、画面左側には船渠の水を抜く施設の煙突が見える。画面中央には船渠の入り口となるトランザトランティク水門が描かれ、入渠できるよう開門されていることから満潮時の水門を描いていることがわかる。

印象・日の出 - Wikipedia

なるほど。かなり当時の詳細について分かっているようですね。
具体的な固有名詞は省いて、大まかなオブジェクトを入れていくことにします。

プロンプトは後述
プロンプトは後述

完成

Seed値のランダム性もあるので、何度か試していきながら、それっぽいものに到達しました。

Prompt :
Le Havre harbor sunrise, small two rowboats and passengers on the water in front, Ship's masts and manual rotating crane and sluice gate and chimney on the distant shore are almost invisible through the haze, dim haze, reflected sunrise light, small sun #c76447 (orange), sky #ac8870 (brown), sea #898989 (gray), boats and passengers #203935 (dark green), buildings on the shore is #737787 (light green), shot by Fujifilm Pro 400H --ar 3:2 --q 2 --v 5

…なんかクレーン描きすぎじゃない?そんな気がしないでもないですが、ここまでで50枚以上描画しているので、そろそろ打ち止めにしておこうと思います。

もっと試行回数を重ねたりすればさらに近づけることは可能だと思います。(Control Netとかはまた別)
ひとまず今回はシンプルなtxt2imgのみでモネの「印象・日の出」を写実的に描画してみよう、という実験としてここで終わろうと思います。

何度も描画していて分かったことは、やはりSunriseの入力はかなりこうしたオレンジに近い色に落ち着きがちと言うことでした。
太陽や空の色味もかなり影響していると思われます。
元の絵は空と海の色を全く違うものとして描いていますが、実際には殆ど同じだったのかもしれません。


もしモネが実際に見た風景がこれだったとするならば、その創造性は半端じゃありません。
この風景を見て「印象・日の出」を描けるというのは、少なくとも今のAIには出来ないことでしょう。
(モネの画風を真似して~や印象画で描いて~のようなプロンプトは禁止として)

その他の実験

こんな感じの画像生成AIを使った実験を他にもいくつか行っています。
今回のものも含めた全15点を、Artstepsというプラットフォーム上でバーチャル個展として公開しています。

無料で特にアカウント登録とかも不要ですので、ぜひご覧下さい。
キャプションには各絵画の解説もあげています。

ご好評頂ければ、他の絵画についてももう少し詳細に解説をnoteに書こうと思うので、ぜひコメント、スキお願い致します!

この記事が気に入ったらサポートをしてみませんか?