【FLUX.1】限界をチェックしておく【ブリッジ】

2024年8月16日 02:30

はじめに

Stable Diffusionに限らず、画像生成AIは逆さまに弱いです。単に学習量が相対的に少ないからだと思いますが、正しく表現できません。指などがかなり改善されたFLUX.1では、どの程度の実力なのか確認しました。

SD3では、草原で仰向けになる人物をまともに表現できないと話題になっていましたが、基本的にAIは通常と異なるポーズが苦手です。

相対的に悪いとは言えませんが、それほど凄いとも言えません。

まあ、そうなるでしょうね。

プロンプトでは埒が明かないので、3Dを利用してポーズを作成します。

映像作品も含めてAIを本格的に映画などに利用するには、様々なポーズや状況を同じクオリティで表現できなければならないと思います。現状のAIはありふれた似たポーズをプロンプトのみで綺麗に生成できますが、特殊な角度やポーズは（絵や３Dや写真で）リファレンスを学習したりして組み込まなければ実現できません。

なんでもできそうな画像生成AIですが、まだまだ技術革新しなければならない余地はあるようですね。

以下、関連記事の【PR】です。

この記事が気に入ったらサポートをしてみませんか？