見出し画像

ここがまだまだだよ! 生成AIリアル系人物画像の不自然な点6つ

元WEBデザイナーが、デザイン関連についてつらつらと書いていきます。今回は生成AIが作るリアル系人物画像の不自然な部分について語ります。デザインの仕事等で生成AIを活用したいと考えている人に読んでいただければ幸いです。


風景や機械は得意だが、人物画像生成はまだまだ苦手

最近は素材配布サイトや広告でも生成AIを利用した画像をみかける機会が多くなりました。データベースに偏りが見られるものの、風景や機械の生成は得意なようです。しかし、人物画像に関しては、写真の代用として使用するには不自然さを感じさせるものしか生成できないように思います。

以下に、生成AIで作成した人物画像に感じる不自然なポイントをまとめてみました。

質感の表現が微妙

人物の生成画像、一見すると写真と見間違えそうになりますが、肌の質感等が再現できておらず、ファンデーションを厚塗りしたような、のっぺりとした質感に仕上がっている画像が多くみられます。また、髪の毛の質感も再現できているとは言い難いです。

広告用途で使用する際は、バナー等のサイズの小さい広告では使えそうですが、紙媒体や美容・化粧品等、質感を重視される分野でモデルの代用、写真の代用として使うにはまだまだ厳しい品質かと思います。
(最近某大手エステサロンがバナー広告に生成AI画像を使っているようですが、肌の肌理ががまったく感じられないので一目でAI生成だとバレてしまいます。エステの広告に肌の質感のない画像を使う感性がワカラナイ。)

トーンの流れが不自然

大分リアリティが増しては来ていますが、まだトーンの流れ、表現は不自然さを感じさせることが多いです。ハイライトからシャドウまでのトーンの流れが、機械的な感じがします。

立体物として存在するものに光が当たって陰影ができているというよりも、平面に影を塗っているような仕上がりになる事が多いです。

特にキャッチライト(反射光)が再現できていない場合が多いように感じられます。なので絶妙に臨場感、立体感、回り込みがなく、レリーフのような半立体の人物と背景が合成されている印象があります。

原因はおそらく写真等、二次元画像の情報を元に生成しているからなのでしょう。これはAIに限らず、写真を元にイラストやデッサンを描いている人にも見られる特徴です。

パーツの比率が微妙

生成AIを使う側のデッサン力の問題もあるかもしれませんが、人物のパーツ、特に頭の大きさが肩幅と比較して大きい、もしくは小さい、顔の大きさに対して目鼻口の大きさがアンバランス等、不自然さを感じさせる仕上がりになる傾向があります。

性別に関係なく若年層を生成した場合や、体格・体形が細いor太い等、平均的な体格以外を設定すると起こる事が多いです。

また、女性を生成する場合、漫画やアニメのように、目が大きくなる傾向があります。リアルタッチで生成しているのに、目が大きすぎるとグレイ系宇宙人のような印象を与えやすく、不気味の谷へと直行してしまいます。

顔の輪郭が不自然

AIが生成した人物画像を国内向けのサービス等で使用する場合、日本人を生成する事が多いと思いますが、欧米文化圏のデータベースが元になっているせいなのか、「リアリティを感じさせる日本人」の生成はまだまだ難しいようです。特に、頬骨から顎にかけての顔の輪郭が不自然になる事が多い様に感じます。

またリアルタッチで生成させているはずなのに、なぜか顔の輪郭が漫画やアニメっぽい形状になる事があります。イラストとして使用する分には許容範囲内かと思いますが、写真素材の代用品として使用してしまうと「コレジャナイ」感を与えてしまいそうです。

視線が不自然

視線の先が左右ちぐはぐになる事があるようです。絵を描きなれていない、描いたことが無い人には一見まっとうに生成されているように見える場合でも、絶妙に左右の視線が異なっていて、気持ち悪さを感じさせる事があります。

また、複数人を同時に生成した場合、それぞれの視線の先をコントロールするのが難しくなるようです。一人一人を生成して合成した場合でも、それぞれの視線のコントロールは難しいと思います。

表情が不自然

無表情やすまし顔はなんとかなりますが、喜怒哀楽、感情の表現は大げさになったり、妙に機械的であったりと、満足のいく仕上がりになる事は少ないのではないでしょうか。特にAIっぽさが出てしまうのが、目と口の形状です。目じりや口角といった細部に、機械的で計算されたような不自然さ、硬さが表れやすいです。

表情の表現はイラストレーター、CGデザイナーが一番苦労する部分、いろいろな表現方法を試行錯誤する部分ではないかと思います。

デッサンのようなリアルタッチで表現しようとしても写真のようなナチュラル感を得られず、漫画やアニメのように、表情を記号化してしまうとリアリティを損なってしまいます。(日本人が漫画やアニメを見て不自然さを感じないのは、そのような表現を「見慣れている」からだと思います。)

3DCGの領域では、近年は実在のモデルを起用して3Dスキャナーやモーションキャプチャを駆使してよりリアリティのある表情を表現できるようになりましたが、AIはまだまだのようです。

機微の表現ができていないと思う

機械的な計算と処理で生成しているせいか、光の流れの機微、表情の機微、ものの質感の機微等、細部の表現ができていないように思います。それはユーザーに「刺さる」クリエイティブにとって重要な要素が全て欠けているとも言えます。広告目的で使用する場合、機微の表現ができていないのは致命的と言えるのではないでしょうか。

絵画、写真、イラストでも言える事ですが、表現とは難しいもので、なんでも精密に描写する、解像度を上げれば良いかというと、そうでもない場合が多くあります。時に曖昧に、ぼかしたり隠したりする(風姿花伝でいうところの「秘すれば花」)ことで逆にものの機微、リアリティが表現できたりすることもあります。

開発者の文化圏、環境、思想、価値観も関係してくる

日本で利用されている生成AIサービスの主流は欧米文化圏発(一部中国、インド他、非欧米圏もあるかも)だと思います。現段階でも、欧米圏に多い顔の特徴は網羅されているようですが、東洋系、少数民族系のような非欧米圏の人達の画像を生成すると、どこか不自然さを感じます。

今後、AIの精度、解像度が上がるにつれて、開発者の所属する文化圏、環境、思想、価値観によって解釈、表現の違いが如実になってくる可能性もあります。

開発者の立ち位置の違いから出る差異を均一にならすのか、それらの差異も全て網羅する流れになるのか、どちらに転ぶのかはわかりませんが、筆者としては、表現の多様性を実現するならば後者の方が望ましいと考えます。

日本人による日本人の趣味趣向にあった、画像生成AIサービスが出てくるとありがたいですね。

2024.03.23 追記

プロのフォトグラファーならポートレート撮影する際にそんなライティング(文章じゃなくて光源の方)にはしないだろうな、と思うようなライティングになってる点も、不自然さを感じさせる要因になっているような気がするので、追記しておきます。

広告等に使用したい場合はライティングの設定にも気を付けるべきかと。


この記事が気に入ったらサポートをしてみませんか?