新しい画像生成AI、FLUX.1の使い方

矢野哲平@耳で学ぶChatGPT

2024年8月11日 15:52

[読了目安: 3分]

NO AI(人間が書きました✍️)

AI系ポッドキャスト(耳で学ぶAI)運営の矢野哲平(@robothink_jp)です。この記事では新しく登場した画像生成AIのFLUX.1を試してみます。

👨‍💻対象読者
- 画像生成AIに興味がある
- または画像生成AIを使ったことがある

🎉記事を読むとできること
- FLUX.1について知ることができる
- FLUX.1を使う方法を知ることができる

FLUX.1

2024年8月に新しく登場した画像生成AIです。開発はBlack Forest Labsという会社で、なんとStable Diffusionの開発者が立ち上げた企業でもあります。

現状モデルは3つ。Pro, dev, schnell(シュネル)です。
ProはFLUX.1の最高モデルであり商用利用も可能。
devは非商用向けのモデルで個人利用や開発者向けでしょうか。
schnell(シュネル)はドイツ語で「速い」のような意味。FLUX.1の中での最速モデルです。ローカル開発と個人的な利用のために調整されています。

FLUX.1を使う

FLUX.1を使うには大きく分けて2つの方法があります。自分のパソコンで環境を整えて使用するか、オンライン上で使用するか。
この記事ではオンライン上で簡単に試せる方法を解説します。
オンラインで使用する場合、Hugging FaceかReplicate、fal.aiの選択肢になります。
Hugging Faceならログイン不要でそのまま試せます。ただし、モデルはdevかschnell(シュネル)になります。

ちなみに、Advanced Settingsからアスペクト比など色々細かい設定ができます。Number of inference stepsを大きくすると品質が向上しますが、生成まで時間がかかるようです。

Replicateやfal.aiではGithubアカウントでのログインが必要になりますが、個人的にはfal.aiがおすすめです。(無料で利用できる枠が多い)
ちなみにAPI経由で画像生成する場合、1枚あたりの金額はおよそ8円ほどです。
Midjourneyの場合、月額10ドルで200枚までなので大きくコストは変わらない感じでしょうか。
FLUX.1はAPIがあるのが良いと感じました。ちなみにMidjourneyは"公式"のAPIはありません。

所感

なんと言っても人物画像ですね。かなりクオリティ高いです。

A young woman sits at a bar in an adult atmosphere. She has long black hair over her shoulders and a calm expression on her face. The background is softly blurred interior, indicating a relaxed atmosphere.

1980’s style in Japan , girl street snap

ピクセルアートもまずまず。

Pixel art, 8-bit, green smoothie on office desk

一方でアニメ風のイラストはMidjourneyに比べると若干弱いと感じました。

Japanese Anime art, facing left, Hands are handling the computer, desktop computer, woman with glasses working, neon light room, blurred background

ちなみに画像への文字入れも得意とのことです。(メニューにFlux.1と入れています)

A young woman sits at a bar in an adult atmosphere. She has long, beautiful brown hair over her shoulders and a calm expression on her face. The background is softly blurred interior, indicating a relaxed atmosphere. She is holding a menu list with 'Flux.1' in her hand.

今まで人物画像の生成と言えばMidjourneyが強かったですよね。
ですがFLUX.1も侮りがたし、です。

日本語で試す

日本語でも生成できます。が、ハルシネーション率が驚くほど高いので英語推奨。
英語プロンプトを日本語に翻訳して出力した画像になります。

大人の雰囲気のバーに若い女性が座っている。長い黒髪を肩にかけ、穏やかな表情をしている。背景は柔らかくぼかされたインテリアで、リラックスした雰囲気を表している。

全く違う画像になっていますね…🤔

目と耳で学べるAI情報を発信しています

通勤時間に効率良く目と耳でAI情報をインプットできます。

AI系ポッドキャスト：https://bit.ly/3TadgCX
X：矢野哲平(@robothink_jp)
動画で学べるAI講座：https://bit.ly/3YI8ktd

noteでも月に30本ほどAI関連の記事を投稿しています。フォローよろしくお願いします😼

この記事が参加している募集

#AIとやってみた

30,505件

この記事が気に入ったらサポートをしてみませんか？