見出し画像

最新イラストAI「Flux.1」を試す! もうMidjourneyは不要? Flux.1の実力と使い方を徹底解説!

テキストから画像を生成するAI技術は日進月歩で進化を続けていますが、ついにStable Diffusionを超えるかもしれないAIが登場しました!

その名は「Flux」。Stable Diffusion開発メンバーが設立したBlack Forest Labsが生み出した、超高画質&超高速な次世代画像生成AIです。しかも、無料デモ版でその実力を誰でも手軽に試せるというから驚き!

1. Stable Diffusion開発陣が仕掛ける新たな挑戦!Fluxとは?

Fluxは、Stable Diffusionの初期開発メンバーが立ち上げたBlack Forest Labsが開発した、最新の画像生成AIモデルです。Stable Diffusionの技術をベースに、更なる高速化と高画質化を実現。よりリアルで、より美しい画像生成を可能にしたと話題になっています。

https://github.com/black-forest-labs/flux

Fluxの開発チームには、VQGAN、Latent Diffusion、Stable Diffusion(Stable Diffusion XL、Stable Video Diffusion、Rectified Flow Transformers)、Adversarial Diffusion Distillationなど、生成AIモデル開発における多くの実績を持つ、著名なAI研究者やエンジニアが名を連ねています。

2. すぐに試せる!Flux無料デモ版の使い方

Fluxの凄さを体感するのに、面倒な登録は一切不要! 公式デモサイトにアクセスすれば、GitHubのアカウントで誰でも無料でデモ版を利用できます

シンプルなインターフェースで、テキストを入力してボタンを押すだけで、驚くほど高画質な画像がわずか数秒で生成されます。

3. 用途に合わせて選べる3つのモデル!「Schnell」「Dev」「Pro」の特徴とライセンス

Fluxには、「Schnell」「Dev」「Pro」の3つのモデルがあり、それぞれ異なる特徴とライセンスを持っています。

  • Flux-Schnell: 最も軽量なモデルで、生成速度が圧倒的に速いのが特徴です。簡単な画像生成や試作に最適で、Apache 2.0ライセンスのもと、オープンソースとして公開されています。

  • Flux-Dev: Schnellよりも高画質かつリアルな画像を生成できるモデルです。よりクオリティの高い画像を求める場合に最適で、非商用利用に限りオープンな重みを持つモデルとして公開されています。商用利用の場合は、Black Forest Labsに問い合わせる必要があります。

  • Flux-Pro: API経由でのみ利用可能な、Fluxの最高峰モデルです。驚異的な画質と表現力で、プロのクリエイターも納得のクオリティを実現します。商用利用も可能なライセンスですが、API利用のための費用が発生します。ReplicateやFAL.aiといったサービスを通じて試用することも可能です。

4. Fluxで生成された驚きの画像例

実際にFluxの無料デモ版で生成した画像をご紹介します。

「台湾の古い街並みを背景に、未来的な鎧をまとった猫耳の日本人女性が魔法の箒に乗って空を飛んでいる。ネオンサインが輝き、嵐のような雨が降っている。写真のようにリアルな画像で、背景の看板には「TAIWAN」と書かれている。」

プロンプトの日本語訳

Flux-Schnell

わずか1.2秒で画像を生成しました。 従来の画像生成AI同様、足などの複雑な部分が破綻しています。ただし、1秒ほどで出力できるので、100枚生成して美しいものを採用するというガチャ方式が可能です。

Flux-Schnell

Flux-Dev

わずか10数秒で驚くほど高画質でリアルな画像を生成しました。手足の破綻もなく、大変美しい画像です。箒には乗っていないので、プロンプトへの忠実度は中間と感じます。

Flux-Dev

Flux-Pro

Flux-Devと同様に美しい画像です。プロンプトへの忠実度はFlux-Devより高いと感じました。また、APIでより細かい設定が可能ですから、利用の幅が広がります。

Flux-Pro

FluxのベンチマークはMidjourney超え

https://blackforestlabs.ai/announcing-black-forest-labs/

Black Forest Labsが実施したベンチマークによると、Flux.1 [pro] と [dev] は、Midjourney v6.0、DALL·E 3 (HD)、SD3-Ultraといった人気モデルを、画質、プロンプトの追従性、サイズ/アスペクト比の可変性、タイポグラフィ、出力の多様性のいずれにおいても上回っています。また、Flux.1 [schnell] は、これまでで最も高度な数ステップモデルであり、同クラスの競合モデルだけでなく、Midjourney v6.0 や DALL·E 3 (HD) のような強力な非蒸留モデルも凌駕しています。

5. まとめ:Fluxは画像生成AIの未来を担うか?

Fluxは、Stable Diffusionの開発陣が生み出した、まさに次世代と呼ぶにふさわしい画像生成AIです。驚異的なスピードと高画質な画像生成能力は、クリエイティブな表現の可能性を大きく広げてくれるでしょう。無料デモ版で誰でもその実力を体感できるので、ぜひ一度試してみて下さい!

さらに、Black Forest Labsは、Fluxのテキストから画像へのモデルスイートに続き、競争力のある生成テキストから動画へのシステムスイートを近日中にリリースする予定です。高解像度かつ前例のないスピードで、正確な動画作成と編集を可能にするとのことなので、Fluxの画像生成能力を考えると、その期待は非常に高いと言えるでしょう。

いいなと思ったら応援しよう!