見出し画像

AIとのつきあい方(画像生成AI編)

近年、クリエイターたちにとってAIに関する動向は無視できないものになってきております。
AIを利用するにしてもしないにしても、
クリエイターとしてどのような方針で活動していくのか、しっかり立場を自覚しておくことが大切なのではないでしょうか?

クリエイターズマガジンは作家のみなさんに、そのための根拠をより精度高く持ってもらうための情報を提供したいと思っていて、AIニュースに詳しい方に記事をお願いしました。
AI関連の事業やってる方で、常に情報追ってるので頼めてラッキーと思ってます!!

毎月一本、AI関連のニュースのキュレーションや考察など頼んでおりますので、ぜひ活動に役立てていただけたらと思います!


イントロダクション

昨年8月頃から急速に盛り上がりを見せてきた、Stable DiffusionやChatGPTなどの生成AIたち。興味はありながらもなかなか手が出せていない……という方も多いのではないでしょうか。AIの能力は今までの常識を根底から覆すほど強力なもので、もはやAIの登場以前と以後とで時代を分けて考える必要すらあります。

今回は、Stable DiffusionやMidjourney、DALL-E 2に代表される「画像生成AI」の基礎知識とそれらが漫画制作へ与える影響についてご紹介します。

画像生成AIの概要

画像生成AIには様々な種類がありますが、現在最も盛り上がっているものが「拡散モデル (Diffusion model)」という手法です。拡散モデルとは、学習時と生成時に「ノイズ除去」の原理を利用して、文字通りピクセルを潜在空間から拡散させていくことによって画像の生成を試みます。

引用元:https://twitter.com/999cc/status/1643603761133412353

学習時には、学習元のイラストを潜在空間に圧縮した上でノイズ付与を繰り返し、テキストとノイズ除去の過程をベクトル空間上に重みのパラメーター(ウェイト)として学習していきます。このとき学習するのは「この画像は『緑色のツインテールの女の子が立っているイラスト』で、こういう特徴があるな!」という傾向です。逆に生成時には、ランダムなノイズ画像から、学習した結果にもとづいてノイズ除去を繰り返すことによって、イラストや写真を作り出しています。

最終的にAIが学習したモデルは、ノイズ除去のために使うパラメーターだけが保存されるため、何億枚もの画像を学習していても、モデルサイズはたった数GBに収まるのです。

引用元:https://twitter.com/999cc/status/1643787291956228096

※もっと詳しく知りたい!という方は、こちらの記事をおすすめします。


■ 世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説!
https://qiita.com/omiita/items/ecf8d60466c50ae8295b

このような、何もないまっさらな状態から今までにない新たな生成物を生み出すAIを、特に生成AI(ジェネレ―ティブAI)と呼ぶのです。

画像生成AIの始め方

もしあなたが、NVIDIAのグラフィックボードを搭載したWindows PCを所有しているのであれば、Stable Diffusion WebUIの導入をおすすめします。グラフィックボードは、ゲーミングPCはVR Ready PCであれば搭載されているはずです。StableDiffusionなどのAIをお手元の環境で動かす際には多くのVRAMを使用するため、グラフィックボードが必要です。

一方で、Macでも利用する方法や、NovelAIなど画像生成できるWebサービスを活用する方法もあります。※なお、Google Colabを使用してWebUIを起動する方法は現在無料では使えなくなってしまったようです。

現在最も最新の技術に触れられるのはStable Diffusion WebUIというソフトです。AUTOMATIC1111という人物によって公開されています。話題のControlNetやAIアニメなどは、このWebUIを使用して実現されています。
(導入方法は以下のような記事が詳しいです。
https://kurokumasoft.com/2023/02/06/stable-diffusion-web-ui/

ただしこれらの導入は、まだまだハードルも高いです。
そこで、本稿ではMidjourneyの導入をおすすめします。

Midjourneyは、StableDiffusionよりも先に発表された、画像生成AIブームの火付け役ともいえる存在ですよね。未だにアップデートで世の中を驚かせ続けています。ちなみに、Midjorneyの派生版であり二次元イラスト特化版であるNiji・journeyも、Midjourneyの中でモードを切り替えて使用することができます。(追加料金はかかりません)

Midjourneyは以下のような特徴があります。


ここから先は

2,144字
この記事のみ ¥ 300

この記事が気に入ったらサポートをしてみませんか?