見出し画像

【FLUX.1】限界をチェックしておく【ブリッジ】

はじめに

Stable Diffusionに限らず、画像生成AIは逆さまに弱いです。単に学習量が相対的に少ないからだと思いますが、正しく表現できません。指などがかなり改善されたFLUX.1では、どの程度の実力なのか確認しました。

逆さ画像生成 FLUX.1

SD3では、草原で仰向けになる人物をまともに表現できないと話題になっていましたが、基本的にAIは通常と異なるポーズが苦手です。

A girl who is upside down (FLUX.1 dev-NF4)

相対的に悪いとは言えませんが、それほど凄いとも言えません。

A woman who is in a bridge pose (FLUX.1 dev-NF4)

まあ、そうなるでしょうね。

Img2imgで無理やり生成

プロンプトでは埒が明かないので、3Dを利用してポーズを作成します。

Blender

FLUX.1の場合(img2img)

Stable Diffusion の場合(img2img ControlNetあり)

まとめ

映像作品も含めてAIを本格的に映画などに利用するには、様々なポーズや状況を同じクオリティで表現できなければならないと思います。現状のAIはありふれた似たポーズをプロンプトのみで綺麗に生成できますが、特殊な角度やポーズは(絵や3Dや写真で)リファレンスを学習したりして組み込まなければ実現できません。

なんでもできそうな画像生成AIですが、まだまだ技術革新しなければならない余地はあるようですね。

以下、関連記事の【PR】です。


この記事が気に入ったらサポートをしてみませんか?