見出し画像

話題の画像生成AIで超初心者が少しでもマシな絵を作るために学んだことをまとめてみる

画像生成AI、流行ってますね!
カッコいいビジュアルがタイムラインを賑わしてますね!
私もこんなん作りたい!
AIならチョチョイのチョイっぽい!
チヤホヤされたい!
いやー未来万歳!

じゃ早速、私もカッコいいビジュアル作っちゃおうかな。
まずはイケてる魔王とか作っちゃうか。
と思って画像生成してみたら…

なにこれ?


ってなった人が私だけじゃないと信じたいので、この記事を書いてます。

えー、先に私のスキルレベルの話しします。画像生成AIを初めて3日目のド初心者です。AIまわりの知識ゼロです。

そして今回の主役、使ってみた画像生成AIは「DALL·E」という奴です。イーロン・マスク氏が出資して設立したAI研究企業が作った奴です。きっとスゴイに違いない。

このDALL·Eがベータ版を公開しておりまして、現在100万人に順次開放中なんですね。
なので利用してみたい人は今すぐウェイティングリストに名前を連ねて順番待ちしましょう!私は半月ぐらいで使えるようになりました。最近はもっと早いっぽい?

初回月50回無料、以降月15回無料!1回で4枚の画像が作れるよ!
無料分は繰り越せず、追加分は課金(115回15ドルです)という利用体系です。なんでちょこちょこ触る趣味レベルなら無料ってことです。

もし追加にするにせよ、15ドルで115回×4枚画像で計460枚作れると。ということは1枚4円じゃん!実質ほぼ無料じゃん!

ただ触る前は「AIって難しいんでしょ…Pythonとか使うんだったら、私は1行もわからんぞ」と恐れていました。
ですがいざDALL·Eを使ってみると、使い方は驚くほど簡単でした。
入力フィールドに文字を書くだけ。
すごーい便利。

簡単なんですけど、出来上がったビジュアルが…
「あれ、思ってたんと違う」となりました。

最初に作ったティラノサウルスとお化けが戦うホラー映画のポスター。絶対に思ってたのと違う。

何度か文言を替えてみるが全然上手くいかず。
こんなんじゃタイムライン賑わわないよ!!
同じ画像生成AIなのに何でだ…
私もこんなん作りたいんや。

とりあえず先行して情報を吐き出しまくってくれてる深津 貴之 (fladdict)氏のnoteやTwitter投稿を読み込んでみることにしました。AIに学習させるレベルの話はさっぱりついていけない…が、この分野は私の領分から離れすぎている。なので画像生成のための文章部分のノウハウ部分を中心に読み込んでいくことにしました。

なるほど、パリコレって生成文にいれると人物の描画品質があがるらしい。

なるほど、時代だけじゃなくて「ヴィクトリア」「ゴシック」やら「アールデコ」みたいな形容する表現を生成文に追加するとよりファンタジー表現ができるのか。

という訳で、とにかく大事なのは「生成文の表現」なのだなとおぼろげながら分かってきました。(厳密には上記は別の画像生成AIの話題なんですが、まぁ似たようなもんだろうという雑な理解)
あと画像生成AI系のDiscordでいろんな生成文章を読み解きながら、いろいろ触ってるうちに、ちょっとずつやり方が分かってきました。
それと同時にこの「画像生成文」ってまさに「詠唱文」だなと思うに至りました。上級魔術士たちの詠唱文には素晴らしいスペルが盛りだくさんなんですよ。

というわけで、まず現状を見てもらいましょう。
以下3日目の生成画像群です。

カッコいいお爺さん
怖そうな女性の像
ファンタジーっぽい背景

よくなってきたよ!随分マシになった!

という訳で、まだまだ画像生成の実験中ですが、その実験した結果をつらつら書きます。
実験の内容は下記のとおりです。

詠唱文をどうイジったらマシなビジュアルが生成できるか


とりあえず詠唱文の実験として、一番ベーシックな「机の上の人形」を生成してみます。表現装飾はなく下記のように書きました。

a doll on the table
良くも悪くもない普通の人形。すごいけども。

だいぶ普通。
The普通の人形が生成されましたね。
これが詠唱文検証のオリジナルになります。

ではいくつか装飾表現を足して言ってみましょう。最強の詠唱文を目指して。


まずはCG系

まずはCGっぽくしてみます。Unreal EngineやOctane Renderなどフォトリアルに強い単語をぶち込みました。ダメ押しに「photorealistic」もいれときましょう。

a doll on the table, unreal engine, octane render, photorealistic 
3DCGで作ったら大変そうなビジュアルが10秒でできたがな。

淡白ながら、それっぽいのができましたね。


次は映画ライティング系

次は質感や陰影を強調してみましょう。
「volumetric lighting」や「cinematic lighting」といった陰影を美しく表現できそうな座標を目指す表現を追加します。

a doll on the table, volumetric lighting, cinematic lighting, moody
怖い。

まぁちょっと怖いですが、それっぽくなりましたね。


次はダークゲーム系

次はゲームビジュアルっぽい装飾表現を足してみましょう。
混ぜるな危険な感じもしますが。思いつくダーク系で描画がカッコいいタイトルを入れてみます。

a doll on the table, Final Fantasy, DARK SOULS, Bloodborne, ELDEN RING
ウェイビー。

入力したゲームイメージとはちょっと違うがいい感じだ。
しかし、もとの人形からずいぶん遠くまで来ましたね。


次は大理石彫刻系

今度は素材を変えてみますか。大理石の彫刻にしてみましょう。ディティールを出すのと照明も頑張ってもらいましょう。

a doll on the table, carved white marble, sculpture, 
beautiful highly detailed, cinematic lighting
高そうになった。


次はゴシックにデコラティブ系

…ただ、いろいろやりましたが、
なんか全体的に淡白ですね。
次はデコラティブに盛ってみましょう。

a doll on the table, concept art, matte painting, gothic, ornate, 
hyperrealistic, fantasy art, insanely detailed and intricate
盛れた!!

おお! 結構盛れましたね。
先人には全然追いつけないですが、少なくとも触ってて楽しい、描画するたびにテンションが上がるビジュアルにはたどり着けました。


最後に盛り盛り系

最後に今回試した詠唱文を全部ぶっこんだらどうなるのかも実験しておきましょう。長いぜ。

a doll on the table, concept art, matte painting, gothic, ornate, 
hyperrealistic, fantasy art, insanely detailed and intricate, 
carved white marble, sculpture, beautiful highly detailed, 
cinematic lighting, Final Fantasy, DARK SOULS, Bloodborne, ELDEN RING, 
volumetric lighting, moody, unreal engine, octane render, photorealistic. 


「いでよ!最強の人形!」

しゅごい。

なんかすっごいトコまで来たね。

という訳で、まだまだ触り始めではありますが、初心者でも「詠唱文」を頑張ると、それっぽいのが作れる、というコトまではたどり着きました。
最初は詠唱文を頑張るという概念すら分かってなかったので大きな進歩ですね!

まぁこの辺のノウハウは一瞬で消え去る気もしてます。しばらくしたらサービス側で回収されそう。
とりあえず今触ってみたいって人のために書いてみました。
未来楽しい〜!!

来世、救われます。