見出し画像

【画像生成AI】それは Dall-E と Midjourney から始まった!

トップ画像 Created by あゆな using Dall-E3

はじめに

こんにちは、kimamanaDr です。

今回は、画像生成AIの登場から今日までの流れについて、分かりやすく見ていきたいと思います!


いちばん簡単な画像生成AIは?

これから画像生成AIを試してみたい人には、Bing Image Creater をおすすめします!

Bing Image Creator は、Microsoft アカウントがあれば無料ですぐに利用できます。

Microsoft アカウントの作成も無料なので、気軽に始められます。

画像生成AIが使えるようになって2年

画像生成AIにはさまざまな種類がありますが、それぞれどのように登場してきたのでしょうか?

まずは、代表的な画像生成AIの登場時期を見てみます。

画像生成AIの登場日を表したグラフ
  • 2021.1.5 Dall-E 

  • 2022.2.1 Midjourney 

  • 2022.8.22 Stable Diffusion 

  • 2023.3.14 Adobe Firefly 

2021年1月、実用的な画像生成AIとして初めて Dall-E が誕生しました。

Dall-E は画期的な技術でしたが、ディープフェイクなどで悪用される懸念から、当初は一般には公開されませんでした。

画像生成AIが一般の利用者に開放されたのは、それから1年半後の 2022年7月のことで、Midjourney が最初 です。

今日の普及から逆に想像ができませんが、画像生成AIを一般ユーザーが利用できるようになったのは、わずか2年前のことになります。

今回はオンラインの画像生成サービスについて

画像生成AIのうち、Stable Diffusion はローカルで利用できるサービスのため、ほかと少し違った特徴があります。

今回は、Stable Diffusion 以外のオンラインの画像生成サービスを紹介します。

Dall-E:会話で簡単に使える

美しい着物妖精のイラスト一枚目
Created by あゆな using Dall-E3
Dall-EとBing Image Generator の登場と経過を表したグラフ
  • 初の画像生成AI

  • ChatGPTと連携して会話形式で使える

  • Bing Image Creator で無料利用可能(枚数無制限、速度制限あり)

DALL-E は、2021年1月に登場した最初の画像生成AIです。

OpenAIが開発した基本技術の CLIP は、その後の Midjourney や Stable Diffusion にも大きな影響を与えました。

美しい着物妖精のイラスト2枚目
Created by あゆな using Dall-E3

DALL-E はディープフェイクなどで悪用される懸念から、当初は一般には公開されませんでした。

しかし Midjourney と Stable Diffusion の公開を受けて、2022年9月に全てのユーザーに公開されました。

Chat GPT では、「絵を描いて!」と頼むだけで簡単にイラストを生成することができます。

2024年8月16日現在、Dall-E3 を Chat GPT では 1日2枚まで、Bing Image Creater では枚数制限無く 無料で利用できます(速度制限あり)。

Midjourney:絵画も実写もアニメも得意

美しい女性がフルートを吹いている絵画風のイラスト
Created by マツドロップ using Midjourney V6.1
Midjourneyの登場と経過を表したグラフ
  • 2022年7月に全ての人に無料で公開

  • 現在は有料

  • 定期的にアップデートされて性能が向上している

Midjourneyは、DALL-Eに続いて登場した画像生成AIで、2022年7月に全ての人が利用できる画像生成AIとして公開 されました。

Midjourney の公開は、画像生成AIが大きく広まりきっかけになりました。

当初は無料で利用することができましたが、2023年3月以降は有料プランのみになりました。

イルカが水面上に跳ねている絵画風のイラスト
Created by マツドロップ using Midjourney V6.0

Midjourney は継続的にアップデートを重ねて性能が向上 しています。

当初から絵画風のアートに定評がありましたが、アップデートによって今は実写風の画像も高いクオリティで出力できるようになっています。

Nijijourney というイラストに特化したモデルも公開されていて、手軽に高品質なイラストを創ることが出来ます。

Adobe Firefly:クリーンで写真が得意

人懐こいゴールデンレトリバーが飼い主の高齢男性にじゃれている写真
Adobe Firefly の登場と経過を表したグラフ
  • Adobe が独自開発

  • Photoshop や Illustrator と連携

  • 著作権がクリーンなデータで学習

Firefly は画像生成AIとしては後発組で、画質については今のところ他のAIに一歩及びません。

しかし、AIでは表現が難しい多人数の写真の雰囲気などをうまく描写できる場合があります。

バーで3人の男女が楽しく食事をしている写真

Photoshop や Illustrator とも連携していて、高解像度化やレタッチなどで効果を発揮しています。

Firefly は著作権がクリーンなデータで学習していて、商用利用に適してる ことをアピールしています。

しかし、学習データベースになった Adobe Stock は他のAIで生成された画像の投稿も受け付けているため、完全にクリーンとは言い難い面もあります。

管理されているAI

今回紹介した3つの画像生成AIは大手の企業がオンラインで提供していて、適切に管理されています。

オンラインサービスには、次のような利点と欠点があります。

オンラインサービスはここが良い!

  • プロンプトだけで簡単に使える

  • 不適切な画像が生成されない

  • 定期的にアップデートされる

オンラインサービスでは、画像を生成する時に設定できる項目が少ないですが、その分プロンプトの入力に集中することができます。

性的・暴力的な画像や有名人の写真など、不適切なものは生成されないようになっているので、できた画像で問題が起こりにくくなっています。

夜に花火に照らされた川の鉄橋をローカル線の列車が走っている絵画風のイラスト
Created by マツドロップ using Midjourney V6.1

定期的にアップデートもされるので、ユーザーが特に行動しなくても性能が向上していきます。

AIも最適にチューニングされているので、指の破綻なども少なく目的に合った画像を効率よく生成することが出来ます。

オンラインサービスの欠点

  • プロンプトだけでは表現が難しい描写がある

  • 生成できない画像がある

  • 将来サービスが変更される可能性がある

画像を生成する時にプロンプトを調整しますが、細かなポーズの調整などは、プロンプト以外も調整できるローカル環境のほうが向いている場合があります。

プロンプトによっては、ドレスやスカートなどが不適切な画像として弾かれる場合があり(弾かれないこともある)、一部のアート作品は生成が困難です。

ハイヒールとストッキングを履いたきれいな女性の足元の写真

アップデートが入ると性能は向上しますが、画風が変わったり以前に利用できたプロンプトの一部が効かなくなることもあります。

また、将来的に 何らかの理由によってサービスが大きく変更される可能性 もあります。

まとめ

今回は、大手のオンライン画像生成サービスについてまとめました。

  • 画像生成AIは、Dall-E と Midjourney から始まった

  • オンラインサービスは手軽で安全

  • その一方で制限もあり、将来的なリスクも考慮が必要

今回紹介した3つのサービスは、これから画像生成AIをはじめる人にとっていずれもオススメのサービスです。

次回は、今回紹介したオンラインサービスと対照的な Stable Diffusion について紹介します!

最後までお読み頂き、ありがとうございます!


クリエイター紹介

今回、私が利用していないDall-E3 と Midjourney について、2人のクリエイターさんから作品を提供して頂きました。

Dall-E3:あゆな さん

Midjourney:マツドロップさん

お二人とも、独自の世界観で素晴らしい作品を発信されています。

作品を提供して頂き、ありがとうございます!


参考書籍

先読み!画像生成AI インプレス 2023年3月

画像生成AIがよくわかる本 秀和システム 2023年5月



この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?