自分のなかの多様性
Midjourney v6モデルのアルファ版が公開されました。
v6はどのような点が進化したのでしょうか?
より長いプロンプトを正確にフォロー
一貫性とモデルの知識の向上
画像プロンプトとリミックスモードの改善
軽度のテキスト描画能力(テキストを「引用符」で記述)
アップスケーラー(解像度が2倍になる)が改良され「繊細(Subtle)」モードと「クリエイティブ(Sreative)」モードの2種類が追加
分かりやすく大きなアップデートは、テキストが描画できるようになったという点でしょう。リリースページにあるプロンプトで早速試してみました。
おおー。
テキストが描けるようになったということは、ロゴ制作などもできるようになったということです。ますます仕事が捗りますね。
新旧バージョン比較してみた(男性)
過去に生成した画像と同じプロンプトを使って、どのぐらい精度が上がったのかをv4,v5と比較してみました。
v5.2でもそこそこのクオリティで生成できるのですが、学習モデルが少ないせいか男性の描画は苦手な印象がありました。特に日本人男性を描いてもらおうとすると、胡散臭い人物が生成されがちでした。
これがv4で生成した日本人男性。使い始めの頃でプロンプトが冗長です。
v5.2では多少こなれてきたものの、わざとらしい笑顔に違和感を感じます。
それがv6だとこうなります。
あ、知り会いにいますね?こういう人。
光の当たり方、服の質感、アンニュイな表情、青ヒゲ、シャツの襟から覗く丸首の白Tシャツ…ぐっとリアルになりました。
CTOとして会社概要に掲載されていても違和感がないクオリティです。
新旧バージョン比較してみた(女性)
以前のバージョンから女性を描くのは得意な印象がありました。
v4で生成したアジア女性は、どことなく古めかしい雰囲気です。
v5.2だとかなりリアルさが増しますが、まだ生成ぽさは拭えません。
それがv6だとこうなります。
やばっ。これはもう人ですね。
光の加減がリアルだし、浮き毛の描写が細かい!
同じプロンプトで生成した画像。肌の凹凸やシミまで描写されています。
さらに興味深いのがアップスケーラーの「クリエイティブ」モード。
これまでは単純に解像度を2x、4xするだけでしたが、クリエイティブモードを通すとより細かく描写しつつ、シミや黒子は除去されてよりアーティスティックな画像に仕上がります。
自分で生成した画像を自分で補正するという、なんとも不思議な機能です。
もうひとつの「繊細(Subtle)」モードでも、若干補正されるようです。
新旧バージョン比較してみた(イラスト)
せっかくなのでイラストも比較してみましょう。
2月に投稿した「note AIアシスタント(β)」のイラストを、v6に描き直してもらいました。まずはv4で生成した画像がこちらです。
v5.2がこちら。既にけっこういい感じです。
v6だとこうなります。
画力!!
Upscale(Creative)するとまつ毛一本まで細かく描写されました。
ディティールの細かさもさることながら、これまでにはなかった艶やかさというか、純粋に絵としての魅力が増した気がします。
自分が手を動かしたわけではないけれど、これだけ描けると楽しいですね。どんどん生成したくなります。
しばらく放置していたお絵描きInstagramをぼちぼち再開しようかな。
眠っていた意欲が生成AIで目覚めた
Midjourneyで一枚目の画像を生成したのが2023年2月8日、そこから10ヶ月で実務に使える画像を量産できるようになりました。一からイラストや写真を学ぶのと比較すると、驚異的なスピード感です。
これまでのMidjourneyは、いかに生成臭さが出ないよう工夫するかが悩みどころでしたが、今回のアップデートでその問題も解消され、今後ますます実務での活用頻度が増していくことでしょう。
子どもの頃はマンガ家になりたいと思っていて、いつも自由帳にマンガを描いていました。本質的に絵を描くのは好きなほうだったのだと思います。
とはいえ人に見せられるだけのクオリティでは描けないため、いつしか描くことを止め、長らく手を動かしていませんでした。
Midjourneyのおかげで、自分のなかに眠っていた描きたい欲を掘り起こしてもらった気がしています。みなさんも、好きだけど得意ではないことを生成AIに委ねてみると、埋もれていた意欲が目覚めるしれませんよ。
では。
この記事が気に入ったらサポートをしてみませんか?