【画像生成AI】それは Dall-E と Midjourney から始まった!
トップ画像 Created by あゆな using Dall-E3
はじめに
こんにちは、きまま / Easygoing です。
今回は、ますます普及しているAI画像生成について、その登場から今日までの流れを分かりやすく見ていきたいと思います。
いちばん簡単な画像生成AIは?
これから画像生成AIを試してみたい人には、Bing Image Creater をおすすめします。
Bing Image Creator は、Microsoft アカウントがあれば無料ですぐに利用できます。
Microsoft アカウントの作成も無料なので、気軽に始められます。
画像生成AIが使えるようになって2年
画像生成AIにはさまざまな種類がありますが、それぞれどのように登場してきたのでしょうか?
まずは、代表的な画像生成AIの登場時期を見てみます。
2021.1.5 Dall-E
2022.2.1 Midjourney
2022.8.22 Stable Diffusion
2023.3.14 Adobe Firefly
2021年1月、実用的な画像生成AIとして初めて Dall-E が誕生しました。
Dall-E は画期的な技術でしたが、ディープフェイクなどで悪用される懸念から、当初は一般には公開されませんでした。
画像生成AIが一般の利用者に開放されたのは、それから1年半後の 2022年7月のことで、Midjourney が最初 です。
今日の普及から逆に想像することが難しいですが、画像生成AIを一般ユーザーが利用できるようになったのは、わずか2年前のことになります。
今回はオンラインの画像生成サービスについて
画像生成AIのうち、Stable Diffusion はローカルで利用できるサービスのため、ほかと少し違った特徴があります。
オンライン
Dall-E
Midjourney
Adobe Firefly
ローカル(+オンライン)
Stable Diffusion
今回はオンラインの画像生成サービスを紹介します。
Dall-E:会話で簡単に使える
初の画像生成AI
ChatGPTと連携して会話形式で使える
Bing Image Creator で無料利用可能(枚数無制限、速度制限あり)
DALL-E は、2021年1月に登場した最初の画像生成AIです。
OpenAIが開発した基本技術の CLIP は、その後の Midjourney や Stable Diffusion にも大きな影響を与えました。
DALL-E はディープフェイクなどで悪用される懸念から、当初は一般には公開されませんでした。
しかし Midjourney と Stable Diffusion の公開を受けて、2022年9月に全てのユーザーに公開されました。
Chat GPT では「絵を描いて!」と頼むだけで簡単にイラストを生成することができます。
2024年8月16日現在、Dall-E3 を Chat GPT では 1日2枚まで、Bing Image Creater では枚数制限無く 無料で利用できます(速度制限あり)。
Midjourney:絵画も実写もアニメも得意
2022年7月に全ての人に無料で公開
現在は有料
定期的にアップデートされて性能が向上している
Midjourneyは、DALL-Eに続いて登場した画像生成AIで、2022年7月に全ての人が利用できる画像生成AIとして公開 されました。
Midjourney の公開は、画像生成AIが大きく広まりきっかけになりました。
当初は無料で利用することができましたが、2023年3月以降は有料プランのみになりました。
Midjourney は継続的にアップデートを重ねて性能が向上 しています。
当初から絵画風のアートに定評がありましたが、アップデートによって今は実写風の画像も高いクオリティで出力できるようになっています。
Nijijourney というイラストに特化したモデルも公開されていて、手軽に高品質なイラストを創ることが出来ます。
Adobe Firefly:クリーンで写真が得意
Adobe が独自開発
Photoshop や Illustrator と連携
著作権がクリーンなデータで学習
Firefly は画像生成AIとしては後発組で、画質については今のところ他の画像生成AIに一歩及びません。
しかし、AIでは表現が難しい多人数の写真の雰囲気などをうまく描写できる場合があります。
Photoshop や Illustrator とも連携していて、高解像度化やレタッチなどで効果を発揮しています。
Firefly は著作権がクリーンなデータで学習していて、商用利用に適してる ことをアピールしています。
しかし、学習データベースになった Adobe Stock は他のAIで生成された画像の投稿も受け付けているため、完全にクリーンとは言い難い面もあります。
オンラインは簡単・安心
今回紹介した3つの画像生成AIは大手の企業がオンラインで提供していて、適切に管理されています。
オンラインサービスは次のような点で優れています。
プロンプトだけで簡単に使える
不適切な画像が生成されない
定期的にアップデートされる
オンラインサービスでは、画像を生成する時に設定できる項目が少ないですが、その分プロンプトの入力に集中することができます。
性的・暴力的な画像や有名人の写真など、不適切なものは生成されないようになっているので、できた画像で問題が起こりにくくなっています。
定期的にアップデートもされるので、ユーザーが特に行動しなくても性能が向上していきます。
AIも最適にチューニングされているので、指の破綻なども少なく目的に合った画像を効率よく生成することが出来ます。
オンラインサービスの欠点
プロンプトだけでは表現が難しい描写がある
生成できない画像がある
将来サービスが変更される可能性がある
画像を生成する時にプロンプトを調整しますが、細かなポーズの調整などはプロンプト以外も調整できるローカル環境のほうが向いています。
プロンプトによっては、ドレスやスカートなどが不適切な画像として弾かれる場合があり(弾かれないこともある)、一部のアート作品は生成ができません。
アップデートが入ると性能は向上しますが、場合によっては画風が変わったり以前に利用できたプロンプトの一部が効かなくなることもあります。
また、将来的に何らかの理由によってサービスが大きく変更される可能性もあります。
まとめ
今回は、画像生成サービスの代表格の3つのサービスについてまとめました。
画像生成AIは、Dall-E と Midjourney から始まった
オンラインサービスは手軽で安全
その一方で制限もあり、将来的なリスクも考慮が必要
今回紹介した3つのサービスは、これから画像生成AIをはじめる人にとっていずれもオススメのサービスです。
後編では、Stable Diffsion とその関連アプリについて紹介します。
最後までお読み頂き、ありがとうございます!
クリエイター紹介
今回、私が利用していない Dall-E3 と Midjourney について、2人のクリエイターさんから作品を提供して頂きました。
Dall-E3:あゆな さん
Midjourney:マツドロップさん
お二人とも、独自の世界観で素晴らしい作品を発信されています。
作品を提供して頂き、ありがとうございます!
参考書籍
先読み!画像生成AI インプレス 2023年3月
画像生成AIがよくわかる本 秀和システム 2023年5月
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?