スマホで画像生成を目指す!Stable Diffusionの基礎知識


SEAART.AIで画像生成を体験された方にとって、次のステップは自分でさらに自由度の高い生成環境を整えることです。今回は、画像生成AIの中でも特に人気が高いStable Diffusionに焦点を当て、その重要な概念を解説していきます。
最終的にスマホで自在に画像生成を使えるようにするために、基本的な知識を理解しておくとスムーズに進められます。

Stable Diffusionは、ユーザーが入力するプロンプトに基づいて画像を生成するオープンソースのAIモデルです。しかし、ただプロンプトを入力するだけでなく、より思い通りの画像を生成するために理解しておくべきいくつかの重要な要素があります。これらを一つずつ説明します。

1. Checkpoint

Checkpoint(チェックポイント)は、Stable Diffusionが学習したモデルデータを指し、数GBのファイルになります。
Stable Diffusionには基本的な標準モデルが存在しますが、ユーザーはカスタムチェックポイントを使うことで、特定のスタイルやテーマに特化した画像を生成できます。たとえば、アニメ風の画像が得意なチェックポイントや、リアルな写真風の画像が得意なチェックポイントなどが公開されています。

- 使い方のポイント: カスタムチェックポイントを利用することで、生成する画像の幅が広がります。インターネット上にはCIVITAI等のサイトで多くのチェックポイントが共有されているため、自分の目的に合ったものを選ぶことが大切です。

2. LoRA (Low-Rank Adaptation)

LoRAは、Stable Diffusionにおいて特定のテーマやキャラクターを学習させるための軽量な学習手法及び学習結果としての数百MB程度のファイルになります。
LoRAを使うと、元のモデル(チェックポイント)を大きく変更することなく、特定のキャラクターやスタイルを追加で学習させることができます。

- 利点: チェックポイント自体を大きく変更しないため、LoRAファイルは非常に軽量で、特定の要素を簡単に追加できます。たとえば、「特定のアニメキャラクター風の画像を生成したい」といった場合、LoRAを使って簡単にモデルを調整できます。

3. ネガティブプロンプト

ネガティブプロンプトは、生成される画像において避けたい要素や特徴を指定するためのテクニックです。通常のプロンプトは「こういう画像を生成したい」という指示ですが、ネガティブプロンプトは「こういう画像にはしたくない」という逆の指示を与えます。

- ネガティブプロンプト例:
  (worst quality), (low res), +出したくないStyle 等

4. サンプリングステップ(Sampling Steps)

サンプリングステップは、Stable Diffusionがプロンプトに基づいて画像を生成する過程で行う反復の回数を示します。
簡単に言うと、AIが画像を調整しながら生成する回数です。

- 少ないステップ数: 画像生成が速いが、品質が粗くなることがある。
- 多いステップ数: より細かい調整が行われ、画像が高品質になるが、時間がかかる。

通常、20〜50ステップが一般的でしたが、画像生成AIの絶え間ない進化により、必要ステップ数は小さく済む傾向にあります。

5. CFGスケール

CFGスケールは、プロンプトにどれだけ忠実に画像を生成するかを制御するためのパラメータです。数値が高ければ高いほど、プロンプトの内容に強く影響され、低ければAIの自由度が増します。

- 低いCFGスケール:より自由で予測不可能な画像が生成される。

- 高いCFGスケール:プロンプトに非常に忠実な画像が生成される。

Stable Diffusionでは、7が標準的で初心者時点では調整する必要はありません。
(現時点最新のベースモデルであるFLUX1シリーズで異なる設定になるので追って説明進めます)

まとめ


Stable Diffusionは、さまざまなパラメータやカスタマイズが可能な非常に強力な画像生成AIです。スマホでの利用も徐々に普及してきており、アプリやクラウドサービスを使えば手軽に画像生成を楽しめます。


- **チェックポイント**で生成スタイルを変え、

- **LoRA**で特定のキャラクターやテーマに特化させ、

- **ネガティブプロンプト**で避けたい要素をコントロールし、

- **サンプリングステップ**で品質を調整、

- **CFGスケール**でプロンプトへの忠実度を設定する。


これらの要素をうまく組み合わせることで、より洗練された画像生成が可能になります。今後は、スマホ+Google環境を活用して、オリジナルアートを創り出せる環境構築の説明を進めていきます。

この記事が気に入ったらサポートをしてみませんか?