見出し画像

【Midjouney】AI画像生成初心者が試行錯誤してみた話

こんにちは。株式会社トルクの山﨑です。今回はAI画像生成初心者がミッドジャーニーを用いて思考錯誤してみた!の記事になります。


AI画像生成のお題は「ピアノの発表会プログラムのイラスト」

私は毎年夏になると義母のピアノの発表会のプログラムを制作しています。(本件は業務外の自主制作になります)これまで制作してきたパンフレットは以下のような感じです。

歴代「リトルコンサートピアノと声楽の集い」プログラム

基本的にはiPadで描いてPhotoshopで最終的に調整をしています。
本件はある程度デザインの自由度が高いため、勉強のためにも今年の発表会のプログラムのイラストはAI生成で起こしてみようと思いました。以下に備忘録も兼ねて試行錯誤の様子を綴っていきます。

1.少女がピアノを弾いているイラスト→マティス風イラストにAI生成する

個人的にアンリ・マティスが好きなためマティス風のAIイラストを目指したいです。そこでまず「少女がピアノを弾いているイラスト」をミッドジャーニーに生成させ、そのイラストを元にマティス風に生成しようとしました。

呪文:a girl, plays piano, with cats, houseplants in the background

ちょっとこれは要素が多すぎます…イラスト自体もあまりうまくいっていません。おそらくこのイラストを元にマティス風にすることは得策ではないと判断し違う呪文に変えます。

2.マティス風AIイラストの呪文をストレートに唱える

それならストレートにマティス風のイラストを描いて欲しいとミッドジャーニーに依頼します。そこで生成されたものが以下です。

呪文:a girl, plays piano, with cats,Henri Matisse style.

惜しい!惜しいけど微妙にそうじゃない!!それに要素が多すぎます。そこで「人間」と「猫」を組み合わせることがゴチャつく要因なのではと考え、猫単体とピアノのマティス風イラストを依頼します。

呪文:a cat on a piano keyboard, Henri Matisse style.

惜しいというか遠ざかりました…なかなか一筋縄にはいきません。また猫の色を指定しないとなぜか黒猫になってしまうため全体の雰囲気が重たくなってしまいます。これもまだ成功とは言えません。(黒猫ちゃんの悪口ではありません。黒猫ちゃん大好きです。)

3.鍵盤に載っている猫の写真→マティス風にAI生成できないか?

まず呪文「a cat on piano's keybord, photo graph. 」だけですと、すごく寄りの写真になってしまうことがわかりました。

呪文:a cat on piano's keybord, photo graph なぜかキジトラ柄になる

あまりにも寄りの構図ですとデザインの素材として使いづらいです。そこで寄りの構図を回避するためにも「wide shot」の呪文と「背景に関する情報」を追加しました。
参考:【AIイラスト】構図の調整に使えるカメラアングルなどのワードまとめ

呪文:a white cat on a black piano's keybord, a piano is simple detail, houseplants in the background, wide shot, photo graph. --ar 3:4

引きの画像ができました。また画像比率「--ar 3:4」を追加しています。この写真をマティス風にして欲しいとミッドジャーニーに頼めば上手くいくのでは…?
参考:【Midjourney(ミッドジャーニー)】画像サイズ(アスペクト比)を指定!

呪文:https://s.mj.run/WCFxEpLXroQ Henri Matisse style. --ar 3:4

鍵盤に乗った白猫の写真を元にマティス風にして欲しいと呪文を唱えましたがまたもやそうじゃないのができあがりました…

4.フラットなイラスト→マティス風にAI生成する

結果から言うとこれが一番上手くできました。「鍵盤に乗っている猫」のフラットなイラストを生成します。呪文には「cute」「pop」も追加しています。

呪文:a white cat on a black piano's keybord, houseplants in the background, wide shot, flat illustration, cute, pop.

右上の黄色背景のイラストがシンプルで良さそうです。こちらのイラストを元にマティス風のイラストをAI生成します。出来上がった画像が以下です。

呪文:https://s.mj.run/UD0FWdSwPYQ like a Henri Matisse taste. --ar 3:4 -

左下の画像はだいぶ良い感じですが鍵盤がなぜか黒鍵のみのため、この画像を元にバリエを生成してもらいます。バリエは以下です。
参考:アップスケール・バリエーション:生成後に表示されるボタン【にじ/ミッドジャーニー】

この中で左下を採用としました!ちょっと彩度が高すぎたり、やはり要素が多すぎるのでPhotoshopでの調整は必要になりますが一からイラストを起こすよりは早いかなと思います。

まとめ

以上、ミッドジャーニー初心者によるAI画像生成思考錯誤でした!
わかったこととしては「呪文はシンプルなほうが良い」「背景情報画角の情報を入れないと被写体をフォーカスして寄りになりすぎる」「写真を元に◯◯風を依頼するとカオスなことが起きる」「◯◯風のイラストを起こす場合は、まずフラットなイラストを生成し、それを元に◯◯風にすると良い」でした。

ミッドジャーニーを使いこなして業務の効率化にも繋げていきたく思います!ではでは。

この記事が気に入ったらサポートをしてみませんか?