見出し画像

【画像生成AIの教科書】 画像生成AI始め方とサービス比較

皆様こんにちは!
私は画像生成AI周りの情報を中心に発信しているDYNAです😊
今回は、これから画像生成AIを使ってみたいという初心者の方に向けて
画像生成AIのはじめかたや使い方と、
どのような画像生成AIがあるのかを紹介します!

画像生成AIとは

昨今、ChatGPTなど生成系AIが話題ですが、
今回は画像を生成するAIについてです。
画像生成AIは、2022年の中盤あたりから世間でも大きな話題になっている
誰でも簡単にハイクオリティーな画像が作れる魔法のような技術です!

自然言語(人間の言葉)で指示すれば、
その指示にそった画像を作ってくれます!
その指示を「プロンプト」と呼びます。
日本語対応していないサービスでは英語で「プロンプト」を入力しますが、
英語が苦手でも大丈夫です!DeepLなどの翻訳サービスを使用すれば問題ありませんよ👍

こういった文章から画像を作る生成AIを
「txt2img」(text to image)などと表記する場合もあります。
他にも画像から画像「img2img」といった方法もあります。
今回は「txt2img」について紹介していきます。
下記に、いくつか画像生成AIで作成した画像の例を載せておきます👍
画像の下にある英語の文章が「プロンプト」です。

絵画からリアルまで様々な画像が作れます
アニメ風やロゴなども作れま〜す

これらはMidjourneyという画像生成AIで作りました。
とても短いプロンプトでも良い感じの画像が作れます!

画像生成AIのサービス表

次にいくつか画像生成AIのメインプレイヤーと、私が注目しているものを表にしたので、そちらを紹介します。

ここに載っていない画像生成AIもあるので調べてみましょう!

まずは表の項目についてです。

▶︎ サービス名:いわゆる画像生成AIの名前です。
▶︎ 提供:その画像生成AIを提供している企業の名前です。
▶︎ 有料 / 無料:詳しい価格は調べてみてください。
         多くは月額で¥1,000 ~ ¥2,000です。
▶︎ 商用利用:各画像生成AIを商用利用する際はライセンス確認が必要です。
▶︎ モデル:画像生成AIのモデル名。どういう技術で生成しているかです。
           詳しい内容はまた別の分かりやすい投稿にします!
▶︎ 特徴:私の主観も混ざっていますが、参考までに。

基本的なメインプレイヤー下記3つです。
・Midjourney
・Dall-E
・Stable Diffusion

下記にいくつかピックアップして紹介していきます!
同じプロンプトを入れて生成される画像も記載しているので、
比較して、ご参考にしてください👍

【Pickup】 Midjourney

リアルな人間(左) 抽象画(中) ドット絵(右)

最初は「Midjourney」です。
Discordというコミュニケーションプラットフォームで使用できます。
こちらは有料ですが、私も一番使う画像生成AIです。
クオリティは抜群で、万人がおしゃれ〜てなる感じです。(語彙、、😭)
簡単なプロンプトでも、内部で少しおしゃれな雰囲気になるように調整を加えてくれているそうです。
にじジャーニーという、日本のアニメ風が得意なモデルも使えます!

【Pickup】 Bing Image Creater

リアルな人間(左) 抽象画(中) ドット絵(右)

次は「Bing Image Creater」です。中身はDall-E2です。
ブラウザで使用できます。
Midjourneyに比べると、ややクオリティーは低いです。
「画像生成AI使ってみたいけど何がおすすめ?」と聞かれた際は
「とりあえず、Bing Image Creater やってみ!」と答えるようにしています。
おすすめする理由は、下記の3つです。
 ・MicroSoftのアカウントさえあれば、ブラウザで簡単に使える
 ・無料で使える
 ・プロンプトが日本語に対応している

【Pickup】 Stable Diffusion

リアルな人間(左) 抽象画(中) ドット絵(右)

次は「Stable Diffusion」です。
実写的な表現が得意です。
強みはなんといっても誰でもカスタム可能なことです!
カスタムとは、例えば「アジア系の綺麗な女性の画像」を作るのが
得意なモデルにするなど、自分好みのモデルにチューニングできます。
最近流行りのAI美女なんかはほとんどがこの画像生成AIで作られています。
ただ、そのハードルが少し高いので、方法などが高額の情報商材となっていたりします。その方法についてもまた別で無料投稿しますね!笑
「ClipDrop」や「DreamStudio」などで調べてもらえば、
カスタムモデルではないですがバニラの「Stable Diffusion」を
ブラウザ上で使えます!

【Pickup】 Leonardo.AI

リアルな人間(左) 抽象画(中) ドット絵(右)

次は「Leonardo.AI」です。
上記の3つに比べると知名度は低いですが、個人的に注目のサービスです。
こちらは、Stable Diffusion がベースになっています。
馬の脚が多いなど破綻する場合があります。
しかし、多機能な点が魅力で、かなりおすすめのサービスです!
下記のような機能が嬉しいです。
・ポーズを指定して画像生成できる(ControlNet)
・背景透過ができる
・生成モデルを選べるので、自分好みの雰囲気にできる
・モデルのカスタムが簡単にできる


【Pickup】 Deep Floyd IF

リアルな人間(左) 抽象画(中) ドット絵(右)

最後は「Deep Floyd IF」です。
画像のクオリティーはやや低いですが、
プロンプトの文章理解が優れています!
実は今の画像生成はいくつか苦手なことがあります、
複雑な構造や抽象的な概念を適切に出力できないことなどです。
具体的には、文字列を指示通りに出力できない("Hello"と書いた看板など)
数を指示通りに出力できない(3等の象など)です。
しかし、この「Deep Floyd IF」はそういった能力が高いです。


画像生成AIのはじめ方と使い方

ではでは、画像生成AIを実際に使い方について説明します。
今回は最初におすすめと書いた「Bing Image Creater」で説明します。
※ MicroSoftのアカウントが必要です。

始め方

まずはブラウザで「Bing Image Creater」と検索してください。
上記のサイトを選択します。
アカウントを登録します。

画像生成の方法

画面上部の入力バーにプロンプトを入力します。
「アニメ風の猫」など、なんでも構いません👍
プロンプトを入力したら、「作成ボタン」を押します。
数秒待てば、画像が出力されます。
是非、お試しあれ!

最後に

本投稿がお役に立てたという場合は「スキ」をいただけると
投稿の励みになります😭
画像生成AI周りの情報を基礎から応用まで網羅的に発信していきますので、よければフォローもよろしくお願いします!

また、私はAI情報発信者のノーベル氏のLINEオープンチャットなどで
画像生成AIの講義などもさせていただいております、
他にも初心者から詳しい方まで様々なメンバーが集い、
学びの多い無料コミュニティーになっていますので、
ご興味のある方は一度覗いてみてください😊


この記事が気に入ったらサポートをしてみませんか?