画像に関して

ラーニングアニマル

2023年7月22日 20:46

生成AI（Generative AI)がブームとなっていますので、現時点でどういったものがあるのか、その機能について学んでいきたいと思います。

画像生成AIに関して

画像生成に関しては、Text to Imageを中心に様々な機能が存在しています。機能面で優れているのは、Stable Diffusionです。Stable Diffusionには機能がいっぱいありますが、いくつか紹介してきます。

Stable Diffusion
まずは、下記のURLに Stable Diffusion Playgroundがあります。お試しは、下記で実行してください。

Stable Diffusionが、凄いのは拡張性です。便利なのは、Stable Diffusion Web UIを使うことです。

画面は下記のようになっており、様々な拡張性があります。

Stable Diffusionの機能(覚えておいたほうが良いもの）
プロンプト
プロンプトは、ほぼ呪文です。「画像の中に描いてほしくないもの」をネガティブプロンプトに書き込みます。

Seed値
画像のSeed値を固定にすると同じような画像を出力することができます。

拡張機能はもっとすごいです。
モデル
Stable Diffusionではモデルを変更することで、様々なイメージを生成することができます。例えば、アジア人の美しい女性を描くには、ChilloutmixやBRA (Beautiful Realistic Asians)といったモデルを指定することで描くことができます。

Lora(Low-Rank Adaptation)
低コストでAIの追加学習を行い、好みの画像を簡単に出力できるようにするツールです。

ControlNet
ControlNetを使用すると、参考としている写真と同様のポーズをとらせることが可能になります。

ディープフェイク（roop for StableDiffusion)
roop for StableDiffusionとは、画像の顔の入れ替えが可能になります。要は、人が立っている写真に、他の人の顔を入れて画像を作成することができます。

他にも様々な機能がありますので、画像生成AIを作成する際、StableDiffusionがおススメです。

その他の画像生成AI

Stable Diffusionは、拡張性に優れていますが、使うのが難しいのが課題です。
SeaArt
Stable Diffusionの機能が使えますので、さまざまな機能を使うにはおすすめです。ControlNetやディープフェイクもできます。

Leonardo
単純に画像生成するのであれば、クオリティが高い画像が出力できます。

Mid Jorney
Discord上で、プロンプトを入力して画像生成してくれます。
クオリティは高いのですが、有料になりました。

https://www.midjourney.com/home/?callbackUrl=%2Fapp%2F

DALL-E 2
OpenAI社の画像生成AIです。作成した画像を編集できます。

Bing Image Creator
Microsoft Bingの画像生成AIです。左下にBingの「b」のウォーターマークが入るので注意です。

Canva
デザインソフトにも、Text to Image機能があります。https://www.canva.com/

まとめ

画像生成AIに関して、機能および、様々なサービスを紹介しました。
単純に Text を画像にするものではなく、ポーズを指定したり、顔を入れ替えたり、狙った画像が出力されるような機能は日々進化しています。
画像生成AIを活用してみましょう！！

画像に関して

画像生成AIに関して

その他の画像生成AI

まとめ

この記事が参加している募集