見出し画像

Midjourney V6.1 になって実写系の人物写真生成に問題が出てきた。(プロンプト付き)

Midjourney は実写系の画像生成に置いても非常に優秀であるのは周知の事実ですが今回のバージョンアップで多少の問題が発生していると思われます。これはあくまでも個人的な印象ではありますが、参考になればと思います。

V6.1の改善点

まず、6.1になってどんな点が良くなったのかサイトから確認しましょう。

V6.1の新機能は?
・よりまとまりのある画像(腕、足、手、体、植物、動物など)
・画質が大幅に向上(ピクセルアーティファクトの低減、テクスチャ、肌の強化など)
・より正確で、詳細で、正しい小さな画像の特徴(目、小さな顔、遠くにある手など)
・画像/テクスチャ品質が大幅に向上した新しい2倍アップスケーラー
・標準的なイメージジョブを約25%高速化
・テキスト精度の向上(プロンプトで「引用」を使って単語を描く場合)
ニュアンス、驚き、精度が向上した新しいパーソナライゼーションモデル
パーソナライゼーションコードのバージョン管理(古いジョブのパーソナライゼーションコードを使用すると、そのジョブのパーソナライゼーションモデルとデータを使用できます。)
・新しい--q 2モードは、画像の一貫性を低下させる代償として、より多くのテクスチャを追加するのに25%時間がかかる(ことがある)。
・全体的に "より美しく "見えるように。

https://updates.midjourney.com/version-6-1/

これを字面だけで捉えると素晴らしい進化と言えるでしょう。

しかし、実写系の人物写真生成においては2点の問題が生じていると感じます。

1.質感の問題

問題

画質が大幅に向上(ピクセルアーティファクトの低減、テクスチャ、肌の強化など)

この進化によって、肌の質感が美しくなりました。しかし、その分CG感というか全体的にツルツルした人工的な肌の感じが強調される絵が増えたと思われます。

例えば下記。とてもきれいですね。

by Midjourney V6.1

それに対して V6

by Midjourney V6

確かにノイズなどは6.1のほうが断然少ないと思われますが、どうしてもCGっぽさが強調された印象になります。拡大して確認してみてください。

予測される原因

これらを問題と捉えるか単なる進化として捉えるかは各自の判断であると思いますが、質感向上の為にノイズを減らしたことが逆に現実感を損なってしまっているのではないかと思われます。適度なノイズは重要です。

考えうる対策

何らかのパラメーターで現実感をアップすることは出来ると思うのですが・・今のところどうすべきが確定出来ていません。この点は対策が可能であれば皆さん教えて下さい。

2.生成される顔の雰囲気について

問題

全体的に "より美しく "見えるように。

これがなぜ問題なのか?この進化などから、生成される人物の顔の方向性が同じ方向に向いていると思われます。それによって顔の雰囲気がとてもにているものが生成されます。

同じプロンプトで試してみましょう。

by Midjourney V6.1
by Midjourney V6

6.1の方が顔に同じような方向性が見られます。この事自体は悪いことではないのですがより理想的イメージに近くなって個性が失われやすく成っていると言えるでしょう。

予測される原因

Midjourney には適応される美的指針というものがあり、それらが強調されることでこれらが起きていると思われます。これは人工知能自体の学習が進めば十分に予想できることでもあります。

つまり、学習の成果によって、平均的美的指針の総和が確立され、より色濃くそれらが当てはめられるということでしょう。

考えうる対策

Midjourneyにはある程度こういったものを調整するためのパラメータがあります。そこで、その美的基準である --stylize(最大が1,000でそれがデフォルト) の値を半分の500に落としてみます。

by Midjourney V6.1 --stylize 500

20-year-old Japanese actress, candid snapshot, high photographic quality, outdoor setting, promotional photo for a movie, detailed, realistic, natural lighting, cinematic atmosphere, Japanese woman, film promotion. --stylize 500 --v 6.1

使用したプロンプト

うううう、そんなに変わらないかも。それじゃ --stylize 0 ならどうでしょう。

by Midjourney V6.1 --stylize 0

20-year-old Japanese actress, candid snapshot, high photographic quality, outdoor setting, promotional photo for a movie, detailed, realistic, natural lighting, cinematic atmosphere, Japanese woman, film promotion. --stylize 0 --v 6.1

使用したプロンプト

色んな意味でバリエーションが出てきました。もう少し実験が必要ですが、確かに stylize の値を調整することで多様な人物を作ることは出来そうです。
ただ、顔だけじゃなくてそのシチュエーションも大きく変わる可能性があるので注意が必要です。

3.まとめ

以上のような状況から現状でリアリティーの高い人物写真を作るためには V6 を使ったほうがいいかもしれません。今後 V6.2 のリリースも控えているのでそうなればまた変わるかも知れませんね。

ただ、顔の方向性の画一化はプロンプトを工夫しないと起きる現象であろうと思っています。この辺は利用者の腕にかかってくるかも知れません。


この記事が気に入ったらサポートをしてみませんか?