見出し画像

画像生成AIサービスを比較してみたStable Diffusion 対 DALL•E

画像生成AI、絵やイラストを描く人、写真を取る人。それらの人たちにとって神となるか悪魔となるか。。今回は2つの画像生成AIを試してみました。
(カバー画像はDALL•Eで作成した画像になります)

Stable DiffusionとDALL・Eの共通部分

どちらの画像生成AIも入力したテキストに基づいて自然言語(英語)から画像を生成するAIになります。何らかの写真を入力情報として提供する必要がなく、短文をテキストボックスに入力するだけで3-4枚の画像を生成するという点で2つのサービスは共通しています。

Stable DiffusionとDALL・Eの違い

コンテンツの所有権
Stable Diffusionは生成されたコンテンツが完全にオープンソースになると明示しています(CC0 1.0 Universal Public Domain Dedication)
逆にDALL•EはOpenAIのコンテンツポリシーとして生成した会社に帰属すると明示されています。
生成するコンテンツに対する制限
Stable Diffusionには特に生成コンテンツに対する制限がなく、サービス利用者の個人情報を取得するといったこともないとの記載があります。
一方でDALL•Eは政治運動、アダルトコンテンツや暴力を誘発しそうなコンテンツの生成は利用規約違反と記載してあります。
機能
Stable Diffusionはテキストベースでの入出力ですが、DALL•Eは生成した画像の編集が可能です。またDALL•Eでは生成された画像を元にバリエーション展開を行う機能も実装されています。
費用
Stable Diffusionは現時点では完全に無料で使えますし、特に利用回数に制限がありません。
DALL•Eは月初に50クレジットが発行され、利用回数ごとにクレジットが消費され消耗されると使用できなくなるという仕様です。利用クレジットは翌月になると回復しますので、もし1ヶ月で利用する回数が多くなければ無料で使い続けることができます。ただ今回実験を行うにあたってテキストを少しずつカスタマイズして使うのに50はちょっと足りない印象でした。

同一のテキストを入力して出力される画像を比較してみた

写真的なスタイル

以下のテキストを入力情報として使いました
”A whole body photo of the new SUV with sports car styling."
選択されたカラーやシェイプは違えどどちらもしっかりとSUVの写真的な画像を作成してくれました。ワードを追加したり、表現を変更することで内容は大きく変わりましたので3Dモデリングやデザイン時のドラフトとしても十分使える内容だと感じます。

Stable Diffusionの出力結果

stable diffusionで生成したSports CarっぽいSUVの画像
Stable Diffusionによる写真的な出力結果

DALL •Eの出力結果

DALL•Eで生成したスポーツカーっぽいSUVの画像
DALL•Eによる写真的な出力結果

イラスト的なスタイル

以下のテキストを入力情報として使いました
”An illustration for sales android with their smile in small shop."
イラスト的な生成は2つのサービスで大きく違いが出ました。DALL•Eの方が日本人が感じるアンドロイドのイラストっぽいものが出力されたと感じます。

Stable Diffusionの出力結果

Stable Diffusionによるイラスト的な出力結果

DALL •Eの出力結果

DALL•Eによるイラスト的な出力結果

コミック的なスタイル

次はコミック的なスタイルを試してみました。テキスト入力情報としては以下の内容を使いました。
”A japanese manga for battle scene between 3 guys and a dragon."
ワードの選定の問題だと思いますが、何度か試した結果全くうまくいきませんでした。Stable Diffusionは絵柄が古い感じで出力され、DALL•Eは日本を感じるものがほとんど存在しないというw
海外サービスなのでこの点は日本でAIサービスを開発する優位性がある分野ですね。

Stable Diffusionの出力結果

Stable Diffusionによる漫画的な出力結果

DALL •Eの出力結果

DALL•Eによる漫画的な出力結果

うまくいく内容とそうでない内容

まだまだうまく使いこなせていませんが、ある程度期待した内容が帰ってくるケースとそうでないケースが見えてきました。現時点ではドキュメントをしっかりと読み込めていませんので、次回はしっかりと読み込んだ上で再挑戦してみたいと思います。

AIを共に製作するパートナーとして

2017年にTEDTalkでKasparovが語った「最強のAIよりもそこそこのAIと人間のタッグの方が強い」というのは非常に興味深い話だと思います。今となってはボードゲームでAIに人間が負けることは当たり前となってしまいましたが、Kasparovは1997年に世界で初めてコンピューターに現役のチャンピオンとして敗れました。その彼がAIを上手に利用することを語ることが非常に興味深いテーマだと感じられます。是非、ご覧になってください。
EUでは法規制も出てきましたが、規制しなかった国が手に入れていくテクノロジーと規制した国との間に生じるギャップが受け入れられなくなることは明白だと思います。いずれにせよAIは発展していくとするならば敵とするのではなく上手に味方につけていくのが最善だと信じています。

この記事が気に入ったらサポートをしてみませんか?