見出し画像

Flux.1とかいう新しい画像生成AIのモデルのすばらしさを皆様にも知っていただきたい。試し方もあるよ!

※ この記事内の生成画像はすべて Flux.1 Schnell で生成した無加工品です

というわけで Flux.1 という新しい画像生成用のモデルが出てかなり面白い!っていう話です

例えばこんな感じの画像とかが簡単に作れます

ただし!
いわゆる美少女AIイラスト的な画像はたぶん満足いくレベルのものは作れません!

でも面白いから!美少女以外をたまには生成してもいいじゃない!

リアルっぽいのならいい感じにならないこともない

Flux.1 って何?Stable Diffusion と何が違うの?

全然よくわかりませんがたぶん Stable Diffusion の親戚あたりです
2024年8月7日時点ではいわゆる webui では使えません

より詳しく知りたい方はこちらの記事あたりを読みましょう!

特に実写風の写真やアートっぽい画像において現状最高峰の画像が生成できます

そして Stable Diffusion のように、モデルがダウンロードできるので自分のパソコン上で動かすことができる!(※)

つまり、めちゃくちゃ適当なことを言うと Midjourney が無料で使えるみたいなイメージですね。適当すぎ?

※ 動かすことができないパソコンもあります

壊れちゃった…

何がすごいの?

かなりキレイだしある程度までなら無茶振りしても応えてくれます!多分!

公式の告知ページには以下の特徴が書かれています!

2024年7月時点で画像生成AI界最強の性能

Midjourney-v6.0Stable Diffusion 3 UltraDALL-E 3、全然知られてないけど超強い Ideogram と比較して同等、あるいはそれ以上のいい感じの画像が生成できると公式は言っております

おそらく同じプロンプトで生成された画像を並べて
「どっちのモデルの生成画像のがいい感じ?」っていうのを選ぶ対決をした結果のスコアのグラフ
各分野ごとの比較。Ideogram の文字再現度以外は全部最強ということが示されてるグラフ

↑ の2画像は https://blackforestlabs.ai/announcing-black-forest-labs/ より引用

実際のところは真面目に比較してないからわかりません
でもそうかもしれないと思わせるだけのパワーは感じます

ひれ伏せ!

なんか三種類あるっぽいけどこれ何?

FLUX.1 には prodevschnell の3種類があります!

pro はプロ用なので課金しないと使えません!モデルも非公開!

dev が一番普通のやつです
モデルが公開されており、画像を生成するだけならは実質的にほぼ無制限で使えます!

schnell はちょっと品質が落ちるけど生成が早い!(dev の5倍~ぐらい)
こちらもモデルが公開されています
Stable Diffusion に詳しい人なら LCM とか Turbo/Lightning みたいなものと思ってもらって構いません
こちらは dev 以上にほとんど何も制限なく使えます!

でもお高いんでしょう?

ウェブでちょっと試したり自分のパソコンで使う分には無料です!
基本的にはね!

ライオンも喜んでます

試してみよう!

さっきも言った通りウェブ上でも自分のパソコンでも試せます

自分のパソコン上で試す!
そのために必要なPCスペックはメモリが16GB以上で VRAM12GB 以上のグラフィックボードを搭載していること!

自分のPCがこれを満たしているかわからない人は!
…ちょっと難しいと思うので ウェブで試す のほうを見たほうがよいでしょう

実際のところこれ以下のスペックでも動かすことはできると思いますが、生成に時間がかかったりするのであんまりおススメはしません

あとプロンプトは自然な英語の文章にするといいと思います!
ChatGPT にお願いしよう!

自分のパソコンで試す

説明を書くのも面倒だし読むのも面倒だと思うのでできるだけ短く!

生成には ComfyUI を使います!インストール方法は…調べてください!
以降、ComfyUI のインストールは終わっているものとします!
サボりじゃないぞ!

まず、モデルファイルをダウンロードします
devschnell がありますが schnell のほうが手軽なのでこちらで説明します

以下のページ を開いて画面中央あたりにある download のリンクからファイルをダウンロードしてください
(ちなみにこれは fp8 版っていう性能わずかに下がるけど容量半分なやつ)

ダウンロードが終わったら flux1-schnell-fp8.safetensors を ComfyUI があるフォルダの中の models フォルダの中の checkpoints フォルダに移動させてください

で、ComfyUI を起動して以下のワークフローファイルをダウンロードして読み込んでください

するとこういう神がかり的にわかりやすいワークフローが表示されます

プロンプトと画像サイズ以外はいじる必要なし!

右下のコアラが出てない?Queue ボタンを押しましょう!
パソコンの性能によりますが数秒から数十秒でコアラ寿司が湧いてきます

これで準備は完了しているので、適当にプロンプトのところを変えて生成してください!
画像サイズは 0.1メガピクセル (320x320ぐらい) から 2メガピクセル (1920x1080ぐらい) の間なら様々な比率で安定して生成できるらしい!

ペンギンも親指を立てています

ウェブで試す

そんなパソコン持ってないよ!
ご安心ください。オンラインで使う方法もあります!

一番簡単なのが公式の Hugging Face Space です

プロンプト入れてちょっと待てば画像が生成されると思います!完全無料!

もやしね、これ

ほかにもいろんなところにあるので探してみてね(Civitaiでもできる)

弊 Discord サーバーでも生成 Bot 動かしてるのでお試しいただけます
(ただし意味不明な画像が強制的に目に入るので気分を害す可能性があり)

自動プロンプト盛り機付き

ライセンス…?とかいうのがどうせややこしいんでしょ!

そうでもない!
dev
schnell も生成した画像に関しては全く制限はないと考えていいと思います

正確には、
dev は FLUX.1 [dev] Non-Commercial License で、モデルの商用利用に対する制限、モデルの出力物を競合モデル(Stable Diffusionとか)の学習に使うなみたいな制限とかがあります
ただし、ここでいうモデルの商用利用はモデルを使った画像生成サービスとかのことであり、出力した画像自体は商用利用を含む様々なことに使っていいと明記してあるので気にする必要なし!

schnell は Apache License 2.0 で、めちゃくちゃ雑ですがほぼなにも制限ないみたいなもんです!

つまり!画像生成して遊ぶ分にはなんも気にしないでヨシ!

やった~

まとめ

お分かりいただけただろうか?

お分かりいただけた方も、お分かりいただけなかった方も、とりあえず試していただければ幸いです

ここで終わり
かと思いきや、この後に本編があるので暇な人は見ていってください!

余談

この FLUX.1 を作った会社
次はテキストから動画生成をするモデルを出す予定らしいです!
(公開されるか、されたところで動かせるのかは別として)

告知ページがカッコいいぞ!

以下、Flux.1 の生成画像が大量にあるだけ

本編です
画像を大量に貼る大義名分を作るためだけにここまでの内容を書きました

ここから先にあるもの
それは弊 Discord サーバー内の生成Botで自分を含むサーバー内の誰かが生成したイケてる画像たちです
(生産者の名前はプライバシーに配慮して伏せさせていただきます)

これらを見て Flux.1 のすばらしさを体感していただければ幸いです
よろしくお願いいたします

注: ちょっと下品な画像が一部含まれています

車の運転席、ハンドルに手を掛けているサングラスを着けた猫、CCTVの映像品質
ステージでポールダンスをするフクロウ
奇跡の上腕二頭筋をアピールするフクロウ
人間の鼻で出来たスリッパ
手足の生えたステーキ用生肉が土煙をあげて走っている、モーションブラー
ドウェインジョンソンそっくりのジャガイモ
膝を抱えて座っている形をした人参、フォトリアル
夜の高速道路を疾走するモナリザの絵画、ドリフト、コーナリング、モーションブラー、写真
カブトムシのコスプレをした男を捉えたGoogleストリートビュー画像
オレンジ仕掛けの時計
頭と顔が目覚まし時計の人
頭がモンスターボールになった一家の昭和時代の家族写真。モノクロ。父、母、娘、息子二人、祖母と祖父がいます。
監視カメラとカラスの融合生物
骸骨がジョッキでビールを飲んでいるけど骨の隙間からジャバジャバ飲んだビールがこぼれまくっている写真
深夜のオフィスの廊下を徘徊する狂気のピエロコアラを捉えたCCTVの監視カメラ映像写真。荒い画像
トイカメラで撮ったチルトシフト写真、スチームパンク風の街並み
トイカメラで撮ったワイドショットのチルトシフト写真、廃工場の風景
photo realistic、悪魔城,8K向け超解像度、ハイパスフィルター。背景に大量の半透明のニコラスケイジの顔
中指を立てたトロフィー
網タイツを履いた脚の生えた戦車
オムツをはいているマッチョな茄子
うんちが車にひかれて潰れるシーンを4コママンガで表現して
💩のレントゲン
ビフォーアフター画像、左側に高級ディナーと"BEFORE"の文字、右側にウンチと"AFTER"の文字
水田に埋まって頭だけ出ているじじい、頭から草が生えている

これらは一部なので、もっと見たい人は Discord サーバーに来てね!


この記事が気に入ったらサポートをしてみませんか?