見出し画像

FLUX.1登場!次世代AIが描くリアルとファンタジーの世界

こんにちは〜!🌟

最近、新しいAIツールやモデルが次々と登場して、ついていくのが大変なくらいですよね😅 でもその分ワクワクもいっぱいで、目が離せませんね。

そんな中で、あの人気の画像生成AI「Stable Diffusion」の開発者たちが、新たに発表した画像生成ツール「FLUX.1(フラックス・ワン)」が話題になっているんです。


本日、テキストから画像を生成する技術において新たな可能性を切り開くFLUX.1モデルのシリーズをリリースいたします。(2024年8月1日)

Black Forest Labs のXの投稿の翻訳


私も「これは試さなきゃ!」と思って、さっそく使ってみました💕 どんな感じで画像が生成されるのか、どんな特徴があるのか、今回はその体験をシェアしていこうと思います。



🎨 FLUX.1って何?


FLUX.1は、Black Forest Labsという企業が作った画像生成ツールなんです。

この企業は、あの有名な画像生成ツール「Stable Diffusion」を開発したエンジニアたちが集まって作られたんだそうです。FLUX.1は、その技術をさらに進化させたもので、AI(人工知能)の力を使って、今まで以上に高品質でいろんな種類の画像を作れるようになったんだそうですよ。



FLUX.1の特徴


1. 大規模モデル

FLUX.1は、非常に多くのデータを使って学習したAIです。具体的には、120億(12B)ものパラメーターを持っています。これにより、非常に高度で詳細な画像を作り出すことができます。

2. オープンソース

FLUX.1は、誰でも自由に使えるオープンソースのソフトウェアです。研究者や開発者が自由に利用したり、改良したりすることができます。これにより、さらに多くの人々がこの技術を活用し、発展させることができます。

3. 高品質な画像生成

FLUX.1は、画像生成の分野で高い評価を受けているStable Diffusionの開発チームによって作られました。そのため、生成される画像の品質は非常に高く、細部まで美しく描かれます。

4. テキストから画像への変換

FLUX.1は、ユーザーが入力したテキストを基に画像を生成することができます。例えば、「青い空に浮かぶ白い雲」と入力すると、そのイメージに合った画像を作り出します。これにより、アイデアを視覚的に表現するのがとても簡単になります☁️☀️



利用できるプラットフォーム


FLUX.1には3つのバリエーションがあり、それぞれに特徴があります。どこで使えるのかも含めて、わかりやすくまとめてみました😊

1. FLUX.1 [pro]

FLUX.1の中で一番性能が高いバージョンです。プロンプト(AIに何を作ってほしいか伝える指示)を忠実に守って、すごくきれいで細かい画像を作り出してくれます。なので、プロフェッショナルな仕事や、もっと本格的な画像が欲しいときにぴったりです。「Replicate」や「fal.ai」というサイトでこのバージョンを使うことができます。また、企業向けにカスタマイズした特別なバージョンも用意されているので、ビジネスで使いたい方は直接問い合わせることができます。

2. FLUX.1 [dev]

FLUX.1 [dev]は、個人や非営利のプロジェクト向けに作られたバージョンです。高性能な[pro]バージョンを元にしているので、かなり良い品質の画像が作れます。「Hugging Face」や「Replicate」、「fal.ai」でこのバージョンを使うことができます。自分でダウンロードして試してみることもできるので、個人的なプロジェクトやお試しで使ってみたい方におすすめです。

3. FLUX.1 [schnell]

FLUX.1 [schnell]は、一番速く動くバージョンで、自分のパソコンや手元で気軽に使うのにぴったりです。無料で利用できるオープンソース(誰でも自由に使えるソフト)なので、気軽に始められます。こちらも「Hugging Face」で使うことができて、ダウンロードして試すこともできます。


🔸 追記:XのGrokでもFLUXで画像生成できるようになりました。

「ブラックフォレストラボと共同で、XでGrokの機能を拡張するために、FLUX.1モデルを実験しています。」Grok-2ベータリリースより

Grokのチャット画面より




🎨 実際に試してみた: FLUX.1で画像生成


FLUX.1でもさっそく画像を生成してみました!以前OpenAIのDALL-E3や、中国発の話題の画像生成 Kolors でも同じプロンプトを試しています。
画像の比較を楽しみたい方は、過去の記事もご参照ください👇

今回のブログでは、FLUX.1 [dev]で作った画像を使っています。

🎨 FLUX.1が描いたアメコミ風画像✨しかし今回はプロンプトに苦戦、、


アメコミ風の画像を作ろうと思って、いつものように「American comic style, young American woman, speech bubble, saying 'OMG', black and white pen drawing(アメリカンコミック風、アメリカ人の若い女性、吹き出し、OMGと言っている、白黒のペン画)」というプロンプトを入力してみました。ところが、今回は画像が生成されず、代わりにこんなメッセージが表示されちゃったんです💧

「NSFW content detected in image 1. Try running it again, or try a different prompt.(NSFWコンテンツが検出されました。再試行するか、別のプロンプトをお試しください。)」

「NSFW」って何?と思う方もいるかもしれませんね。これは「Not Safe For Work」の略で、職場や公の場で見るには不適切な内容が含まれている可能性があるという警告です。今回はFLUX.1が「このプロンプトだと、ちょっと危ない画像ができちゃうかも?」と判断してしまったようなんです💦

正直、どこが引っかかったのか全然わからなくて、「OMG」という言葉が問題なのか、それとも「young American woman(若いアメリカ人女性)」の部分がNGだったのか、いろいろ言葉を入れ替えて試してみました🤔💭 最終的に「black and white pen drawing」を「Line art(線画)」に変えたら、ようやく画像が生成されました!やれやれ😅 でも、なぜそれでOKになったのかは、いまだに謎のままです…👀💧



文字はとても美しく生成されました。画力も噂通りとても高いようです💕

🎨 FLUX.1のフォトリアリスティックな人物描写力は?!


今回は、FLUX.1のフォトリアリスティックな描写力を試してみました✨まずは「A beautiful Japanese girl in her 20s, smiling while holding a camera, on a beach, at sunrise(日本人の20代の女の子、カメラを構えて微笑んでいる、海岸、朝日)」というプロンプトで挑戦。

こFLUX.1はネガティブプロンプトなしで生成できるんですが、指もとても綺麗に描かれていて驚きました🎉


次に、男の子も生成してみました。プロンプトは「An 18-year-old Japanese male, with a K-pop star appearance, a gentle smile, wearing a white shirt, one hand touching his hair, with a blurred ocean background(18歳の日本人男性、K-popスターのようなルックス、穏やかな笑顔、白いシャツ、片手を髪に当てている、背景はぼやけた海)」です。


18歳の設定で生成


まずは「18歳」で生成してみたのですが…うーん、可愛いけど「18歳」にしてはちょっと幼すぎるような🤔?そこで、設定を20歳に変更して再挑戦。

20歳の設定で生成

20歳の設定で生成すると、少しヒゲの剃り跡が現れてきました!なるほど、少し大人びた感じがしますね。

では、もっとお兄さんにしたらどうなるか気になって、25歳で試してみました。

25歳の設定で生成

えっ😳!?25歳で急に年齢感が出てきた気がするんですけど?いきなりここまで落ち着いた雰囲気に?!

じゃあ、30歳にしたらどんな感じになるんでしょう…?💦

「30歳」の設定で生成

あれっ、なんだか若返っちゃってる?!💦 しかも、20歳の時の画像を別角度から撮ったような感じが…

年齢感の再現はけっこうランダムなのかもしれませんね〜😅


あ、ちなみにこれ👆は、「20歳」の設定で生成したスイーツ男子です。

表情もとても自然なんですけど、「スプーンを持つ」という仕草が意外とできない生成モデルは多くて、こんなに上手に描けているというのはすごいと思います🫢




🎨 さまざまなスタイルを美しく描き分ける FLUX.1



今回は、FLUX.1でいろんなスタイルのイラストを描き比べてみました!水彩画風のコーヒーショップ、デジタルアートで描いた猫、アニメ風のキャラクター…どれも本当に可愛くて、FLUX.1の実力にびっくりです👌✨


「Watercolor painting, steaming coffee, coffee shop, warm atmosphere」


「Digital art, long-haired white cat, cute pose, background full of flowers」


「Anime style, 20s blue-haired twin-tailed beautiful girl, speech bubble, saying 'Hello'」


FLUX.1って、どんなスタイルも本当にうまく描き分けてくれるから、感動しちゃいます!💕

ただ、いろんなイラストを生成していると、やっぱり「あの」メッセージが出ちゃうんですよね。「NSFWコンテンツが検出されました。再試行するか、別のプロンプトをお試しください」というもの💧。プロンプトのどの部分を直したらいいのか悩むことも多いですが、逆にこれが安心できるポイントでもあるのかなと思いました。

一年ほど前にStable Diffusion系のモデルで女の子のイラストを生成していたときは、全く意図していないのにびっくり赤面するような画像が突然現れちゃうので、人前で生成するのはちょっと…ということもあったんです🙈💦

その点は、FLUX.1は配慮されているようなので、安心して使える気がします。

皆さんもぜひ、いろいろなプロンプトでFLUX.1を試してみてくださいね👋


追記:このブログはReplicate上からFLUX.1 [dev]を使用しながら書いたものだったんですが、その後XのGrok2からFLUX.1を使用してみて、生成制限がほとんどないことに逆にびっくりしてしまいました💦。そのお話はこちらからどうぞ👇




この記事をお読みいただき、本当にありがとうございます

もし気に入っていただけたら、いいね「🩷」で応援していただけると嬉しいです。フォローもお気軽に!

よろしくお願いいたします🥰


noteからお知らせをいただきました🙇‍♀️


無料画像配布

note 「みんなのフォトギャラリー」 (1万回シェア感謝🙇‍♀️) や Pixabay ( 4万DL感謝🙇‍♀️) では、画像を無料で配布しておりますので、ぜひご利用ください。

有料画像販売

PIXTAAdobe Stock などでも販売しておりますので、こちらもご検討いただけますと幸いです

いいなと思ったら応援しよう!

素晴木あい@ AI絵師
サポートをお考えいただき、ありがとうございます🌸貴重なご支援を画像生成やブログ作成の資金として使わせていただきます✨

この記事が参加している募集