見出し画像

自分のなかの多様性

Midjourney v6モデルのアルファ版が公開されました。

v6はどのような点が進化したのでしょうか?

  • より長いプロンプトを正確にフォロー

  • 一貫性とモデルの知識の向上

  • 画像プロンプトとリミックスモードの改善

  • 軽度のテキスト描画能力(テキストを「引用符」で記述)

  • アップスケーラー(解像度が2倍になる)が改良され「繊細(Subtle)」モードと「クリエイティブ(Sreative)」モードの2種類が追加

分かりやすく大きなアップデートは、テキストが描画できるようになったという点でしょう。リリースページにあるプロンプトで早速試してみました。

a photo of the text "Hello World!" written with a marker on a sticky note --ar 16:9 --v 6.0

おおー。

テキストが描けるようになったということは、ロゴ制作などもできるようになったということです。ますます仕事が捗りますね。

Simple vector logo with the word "OURSELVES" and a deformed illustration of a Shih Tzu dog --v 6.0

新旧バージョン比較してみた(男性)

過去に生成した画像と同じプロンプトを使って、どのぐらい精度が上がったのかをv4,v5と比較してみました。

v5.2でもそこそこのクオリティで生成できるのですが、学習モデルが少ないせいか男性の描画は苦手な印象がありました。特に日本人男性を描いてもらおうとすると、胡散臭い人物が生成されがちでした。

これがv4で生成した日本人男性。使い始めの頃でプロンプトが冗長です。

Color photo, 30 year old CTO tapping laptop colored blue, Japanese male, thin, short hair, Jacket style,Buddha-like expression, smile,upper body shot from oblique front, pure white background, taken with Canon 5D Mk4 --ar 16:9 --v 4.0

v5.2では多少こなれてきたものの、わざとらしい笑顔に違和感を感じます。

Color photo, 30 year old CTO tapping laptop colored blue, Japanese male, thin, short hair, Jacket style,Buddha-like expression, smile,upper body shot from oblique front, pure white background, taken with Canon 5D Mk4 --ar 16:9 --v 5.2

それがv6だとこうなります。

Color photo, 30 year old CTO tapping laptop colored blue, Japanese male, thin, short hair, Jacket style,Buddha-like expression, smile,upper body shot from oblique front, pure white background, taken with Canon 5D Mk4 --ar 16:9 --v 6.0

あ、知り会いにいますね?こういう人。

光の当たり方、服の質感、アンニュイな表情、青ヒゲ、シャツの襟から覗く丸首の白Tシャツ…ぐっとリアルになりました。

CTOとして会社概要に掲載されていても違和感がないクオリティです。

新旧バージョン比較してみた(女性)

以前のバージョンから女性を描くのは得意な印象がありました。

v4で生成したアジア女性は、どことなく古めかしい雰囲気です。

Asian female, 20s, neat fashion, wearing white dress. --ar 16:9 --v 4.0

v5.2だとかなりリアルさが増しますが、まだ生成ぽさは拭えません。

Asian woman, 20s, neat fashion, wearing white dress. --ar 16:9 --v 5.2

それがv6だとこうなります。

Asian woman, 20s, neat fashion, wearing white dress. --ar 16:9 --v 6.0

やばっ。これはもう人ですね。
光の加減がリアルだし、浮き毛の描写が細かい!

同じプロンプトで生成した画像。肌の凹凸やシミまで描写されています。

Asian woman, 20s, neat fashion, wearing white dress. --ar 16:9 --v 6.0

さらに興味深いのがアップスケーラーの「クリエイティブ」モード

これまでは単純に解像度を2x、4xするだけでしたが、クリエイティブモードを通すとより細かく描写しつつ、シミや黒子は除去されてよりアーティスティックな画像に仕上がります。

自分で生成した画像を自分で補正するという、なんとも不思議な機能です。

Upscale(Creative)

もうひとつの「繊細(Subtle)」モードでも、若干補正されるようです。

Upscale(Subtle)

新旧バージョン比較してみた(イラスト)

せっかくなのでイラストも比較してみましょう。

2月に投稿した「note AIアシスタント(β)」のイラストを、v6に描き直してもらいました。まずはv4で生成した画像がこちらです。

Note AI Assistant, monochrome, illustration, japanese manga style, female, simple white background --ar 16:9 --v 4.0

v5.2がこちら。既にけっこういい感じです。

Note AI Assistant, monochrome, illustration, japanese manga style, female, simple white background --ar 16:9 --v 5.2

v6だとこうなります。

Note AI Assistant, monochrome, illustration, japanese manga style, female, simple white background --ar 16:9 --v 6.0

画力!!

Upscale(Creative)するとまつ毛一本まで細かく描写されました。

ディティールの細かさもさることながら、これまでにはなかった艶やかさというか、純粋に絵としての魅力が増した気がします。

自分が手を動かしたわけではないけれど、これだけ描けると楽しいですね。どんどん生成したくなります。

しばらく放置していたお絵描きInstagramをぼちぼち再開しようかな。

眠っていた意欲が生成AIで目覚めた

Midjourneyで一枚目の画像を生成したのが2023年2月8日、そこから10ヶ月で実務に使える画像を量産できるようになりました。一からイラストや写真を学ぶのと比較すると、驚異的なスピード感です。

これまでのMidjourneyは、いかに生成臭さが出ないよう工夫するかが悩みどころでしたが、今回のアップデートでその問題も解消され、今後ますます実務での活用頻度が増していくことでしょう。

Japanese busibness woman, 20s, upper half of body, smile --ar 16:9 --v 6.0

子どもの頃はマンガ家になりたいと思っていて、いつも自由帳にマンガを描いていました。本質的に絵を描くのは好きなほうだったのだと思います。

とはいえ人に見せられるだけのクオリティでは描けないため、いつしか描くことを止め、長らく手を動かしていませんでした。

Midjourneyのおかげで、自分のなかに眠っていた描きたい欲を掘り起こしてもらった気がしています。みなさんも、好きだけど得意ではないことを生成AIに委ねてみると、埋もれていた意欲が目覚めるしれませんよ。

では。

Santa Claus holding a letter with "Merry Christmas" written on it. --v 6.0


この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?