見出し画像

OpenAI, Microsoft, Googleの画像生成AIの使い分け (2024年2月版)


はじめに

Geminiも出たので最近画像生成AIは使い分けをしています。画質的にはMidjourneyがいいらしいのですが、ChatGPT Plus+無料ツール群、という制約の中で使い分けの現状をお話しします。

利用環境

本当はすべて有料で比較するのが正しいのですが、以下のような環境で使っています。ですから、どう使うかが正しいかではなく以下のような環境でどう使っているかの備忘録です。

  • ChatGPT Plus

  • Image Creator from Microsoft Designer

  • Microsoft copilot (スマートフォンアプリ)

  • Gemini (無料版 Gemini Pro)

使い分け

環境で並べた順番に使います。

  • ChatGPT: まずChatGPT PlusでDALL-E 3を使って生成します。しばらく試行錯誤してうまくいかないときにはChatGPT Plusをあきらめて次に行きます。リミットいっぱいまで使うと3時間待たされるので画像生成以外の作業に支障をきたします。

  • Image Creator: 次にImage Creatorで試します。これもブーストリミットがあるのでいくつか試します。ブーストがなくなっても遅くていいなら使えるという話もあったのですが、ブーストがなくなると生成というボタンがグレーアウトして使えなくなったります。

  • Copilot(app): Image CretorでだめならMicrosoft Copilot (スマートフォンアプリ)に移ります。初めからMicrosoft Copilotに行ってもいいのですが、スマホから画像を移す手間が面倒くさいので、後回しにしています。リンクをコピペするだけですが、心理的に面倒くさいです。

  • Gemini: 以上3つは結局使っているのはDALL-E 3なので、DALL-E 3が明らかに苦手な領域の場合はGeminiを使います。今のところ、Geminiの守備範囲は数字をいれたプレゼン用の画像の試行錯誤です。


使い分けの基準

次のような使い分けをしています:

  • アスペクト比を指定するのならChatGPT Plus:アスペクト比2:1を出すにはChatGPT Plusを使っています。Copilot(app)は生成したあとに"16:9にして"みたいな継続プロンプト例が出たりしますが、実際には1:1の画像が生成されます。

  • 抽象的な概念を出すのなら ChatGPT Plus:気分的にChatGPTがいい感じに言い換えてからDALL-E 3を呼んでくれるような気がします。格差とか法の支配とかでもそこそこいい感じの絵を生成してくれます。

  • 試行錯誤の数が多いならCopilot (app):Microsoftが戦略的に上限なく生成してくれているような気がしますので数が多いのはこれで生成します。

  • 英文字や数字を画面の中に埋め込むならGemini:必ずしも正確には出ませんがDALL-E 3系よりましな気がします。残念ながら日本語の文字をうまく画像に入れてくれる無料の生成AIはこのなかにはありません。

おわりに

GPT-4 も Gemini (Ultra, Pro) も日進月歩なのでずっとこのままというわけでもないと思います。とりあえず2024年2月現在の使い分けをお話ししました。

参考文献

Gemini https://gemini.google.com/

Image Creator for Microsoft Designer https://designer.microsoft.com/image-creator


この記事が気に入ったらサポートをしてみませんか?