見出し画像

画像生成AIモデル「FLUX1.1[pro]」と従来バージョンとの比較

 こんにちは、Browncatです。
 以前、Black Forest Labsの画像生成AIモデル「FLUX.1」の使用経験について書かせていただきましたが、それからそれほど時間が経過していない2024年10月3日、FLUX.1 [pro]の後継バージョンとみられる「FLUX1.1 [pro]」をリリースしました。
 そこでFLUX1.1[pro]を同社の従来バージョンと比較しました。


FLUX1.1 [pro]について

 FLUX1.1 [pro]のリリースを伝える同社の以下のブログ記事によれば、FLUX1.1 [pro]はFLUX.1 [pro]との違いについて概略以下のように述べています。

  • FLUX.1 [pro] (従来版)より 6 倍高速な生成を実現

  • 画質、プロンプトの順守、多様性も向上

 FLUX.1系には[pro]のほか、[dev]と[schnell]がありますが、[pro]は他とは異なり学習・推論(生成)環境がブラックボックスで、画質改善するには外部がモデルをさわることができず、同社による改善を待つしかなかったので、[pro]の動向を注目していました。
 なお、原稿執筆時点(10月4日)では、FLUX1.1は[pro]のみで、[dev]や[schnell]はありません。

生成例

 それでは今回も生成例を提示し、従来版と同一プロンプトで比較してみます。
 FLUX1.1 [pro]との比較対象は、FLUX.1[pro]と[dev]のみとさせていただきます。画像サイズは画像サイズは横896 x 縦1152ピクセル、生成環境は前回に引き続き「fal.ai」を利用させていただきました。
(fal.aiはFLUX1.1[pro]のリリースとともに同モデルの生成サービスを開始しました)

1.カラフルな天使

【FLUX1.1 [pro]】

FLUX1.1 [pro]:カラフルな天使

 以下に示すFLUX.1 [pro]に比べると、よりダイナミックで、はっきりとしていて、色彩が強い表現になっています。
 ただしあくまでも個人の贅沢な望みですが、画像の色飽和度が大きく感じられ、もう少しナチュラルな彩度になってくれればと思います。
 また、従来に比べて背景のボケ味が強く、そのことについての評価は各人で別れると思います。

【FLUX.1 [pro]】

FLUX.1 [pro]:カラフルな天使

 FLUX1.1 [pro]に比べて、フォト感がかえって高くなっています。ただし題材がファンタジーなので、FLUX1.1 [pro]に比べ表現が物足りないという人もいるかもしれません。

【FLUX.1 [dev]】 

FLUX.1 [dev]:カラフルな天使

 FLUX.1 [pro]と同様、フォト感が高く、[pro]との違いがよくわかりません。

プロンプト:

photorealistic, cinematic film, An angel woman like Japanese idol with colorful angel wings, wearing a colorful frilled dress, poses sitting on a pedestal above the clouds looking at the viewer, upper body, smile

2.りんごの入ったかごを持つ女性

【FLUX1.1 [pro]】

FLUX1.1 [pro]:りんごの入ったかごを持つ女性

 りんごや女性の衣装(ディアンドル)、表情や胸のあたりが生々しいほどにリアルです。一方、背景のボケが従来よりやや強くなっています。

【FLUX.1 [pro]】

FLUX.1 [pro]:りんごの入ったかごを持つ女性

 非常にバランスの良い写真画質といえますが、FLUX1.1 [pro]ほどの生々しさ・力強さは感じられません。

【FLUX.1 [dev]】 

FLUX.1 [dev]:りんごの入ったかごを持つ女性

一見、FLUX.1 [pro]とあまり印象の違いを感じませんが、背景がFLUX.1 [pro]よりシンプルになっています。

プロンプト:

photorealistic, cinematic film, a Japanese young woman in a cleavage red dirndl dress with a red bow around her neck is taking the fruit basket with red apple, in the wooden living room

まとめ

 FLUX1.1 [pro]は従来のFLUX.1 [pro]やFLUX.1 [dev]に比べ、よりダイナミックで、はっきりとしていて、色彩が強く、ボケ味も強い表現になっています。


この記事が気に入ったらサポートをしてみませんか?