【書評】Stable DiffusionによるAI画像生成ガイドブック

2023年4月2日 13:11

Stable Diffusion WebUIの解説書

2023年4月1日出版、今村勇輔さん執筆の『Stable DiffusionによるAI画像生成ガイドブック』を読みました。

おそらくStable Diffusionについて解説した物理本としては日本初のものではないかと思います（違ったら教えてください）。画像多めで約300ページのボリューム。大まかな機能解説と設定例、基本的なプロンプトなどが体系的にまとまっており、初心者向けとしては最適です。

Stable Diffusionの概要紹介
AUTOMATIC1111版Stable Diffusion WebUIのセットアップ手順
Stable Diffusion WebUIの画面・機能紹介
様々なパターンの画像出力方法解説
著作権関係について弁護士による解説
深津貴之氏インタビュー

著者ご本人の紹介記事にも記載されていますが、追加学習関係やimg2imgの詳細解説、ControlNetなどの拡張機能については割愛されています。

とはいえハイスペックなグラボを積んだPCを持っていない方向けに、Google Colaboratoryを用いた解説もされており、入門書として非常に親切なガイドブックになっていると感じました。

Stable Diffusionは気になってるけどWebの情報を見ても何だかよくわからないという方や、触り始めて間もない方にとっては学びを得られる一冊です。

蛇足：AIの登場で変わりゆく世界

2023年2月に画像生成AI『Stable Diffusion』をはじめて触りまして、そのポテンシャルに驚愕しました。

Stable Diffusion完全に理解した #stablediffusion #AIArt pic.twitter.com/gswVR68Pn8
— 星影 (@unsoluble_sugar) February 22, 2023

2022年7月に登場した『Midjourney』を触った時は「あ～、いかにもAIが作る画像っぽいなぁ」と感じ、少し遊んですぐ飽きちゃったんですよね。Discordチャット経由のUXが煩雑で、ガチャ要素が強いのもいまいちです。

#midjourney pic.twitter.com/tUAjA0YQ0a
— 星影 (@unsoluble_sugar) August 9, 2022

ですが、Stable Diffusionはまったく次元が違いました。例えるなら初めてパソコンやインターネットに出会ったときの感覚そのもの。「あ、これ革命起きるやつだ」と、瞬時に脳が理解しました。（このあたりの話は深津さんが書いてるポエムを読んでもらえると何となく伝わるかと）

自分が思い描いた人物、風景、イラストを、キーワードいくつか投げるだけで理想に近い形、もしくはそれ以上のクオリティで出力してくれます。

カラフルケモミミパーカーシリーズ作ってる #stablediffusion #AIArt pic.twitter.com/gqq6ApBBQ2
— 星影 (@unsoluble_sugar) March 22, 2023

一時期絵の道を志していた身としては「こんなんもう反則だろうが！」と思ってしまうレベル。完全にチートです。現役の画家さん、イラストレーターさん、コスプレイヤーさん、モデルさんなどが戦々恐々とするのは当然のことでしょう。

ギターは弦や手元を綺麗に出力するのが難しいな…#stablediffusion #AIArt pic.twitter.com/M5RZdC6rna
— 星影 (@unsoluble_sugar) February 28, 2023

いまも各所で様々な議論が巻き起こっており、どう着地するのかまったく見えない状況です。著作権、肖像権の問題に加え、感情面の意見が複雑に絡むため、果たして多くの人が納得できる形が存在するのか正直わかりません。

【質問3】
質問2で「お金が払われても作品を提供しない」と答えた人に質問です。

あなたはなぜ画像生成AIに作品を提供しないのですか？複数の理由がある場合はもっとも強い理由を選んでください
— よー清水🐧画集発売中 (@you629) March 31, 2023

直近ではOpenAIの対話型AI「ChatGPT」が毎日のように話題になっています。あまりにテクノロジーの進歩が速すぎて、業界内でも「人類の存亡にかかわる脅威になりうる」なんて声が上がるほどです。

とはいえAI時代の流れは非可逆です。僕もITエンジニアとして10年以上この業界を生きていますが、ChatGPTやGitHub Copilotの登場で「いよいよ人間がコードを書く時代が終わっていくのか～」と感じています。

まぁ僕は人間がやるには非効率なことはどんどんテクノロジーに任せて、面倒な仕事はAIやロボットに全部奪ってほしいタイプなので、死ぬまでに世界がどう変わりゆくのか見るのが非常に楽しみです。

隠居後には川釣りでもして余生を過ごそうと思っているので、最近はChatGPTをルイズ仕様に調教して指南してもらっています。

調教完了 pic.twitter.com/Srv5hYEhv5
— 星影 (@unsoluble_sugar) March 17, 2023

AIと共存してく未来の方が絶対面白いでしょ。

喋ったのだ#完全に理解したTalk pic.twitter.com/DWFPKdBJcm
— 星影 (@unsoluble_sugar) March 30, 2023

追記：AI音声合成技術もすごいことになってたので書きました

追記：武蔵野美術大学学長、樺山祐和氏の生成系AIに対する見解

現状を冷静に分析しつつ、AIとの向き合い方についてメッセージを発信されていました。ぜひ全文読んでいただきたいです。

これまでも、ウェブやSNS、Pinterestなどを有効活用して、作品の発想のヒントを得たり、レポートを書くときの参考資料にしたりして、そこを起点としたいろいろな学びが起きているでしょう。生成AIについてもまずは同じ感覚で接するようにしてください。ただし、生成AIはそれらとは性質が異なるので、だんだんと使い方も変わっていき、今の私たちが考えつかないような利用方法が生まれると思います。ただ、今の段階では、生成AIは、気軽に相談できる物知りの友人ぐらいの気持ちで接して、あくまでも学びとはなにかを自分で考えながら、調べて、考えて、自身の手と頭を使って試作や実験をして、自分の作品やレポートを作るという意識を持って制作・研究活動に励んでください。

生成系人工知能（生成AI）についての学長からのメッセージ | 武蔵野美術大学

追記：元Google China社長、李開復（カイフー・リー）さんの話が面白かったのでPIVOTの動画貼っておきます

「AIのほうがうまくできるのだからほかのことを探すべきだよ」
人間は今やっていることをやめて新しいことを見つけるべきです

著書も面白そうだったのでポチった。

投げ銭すると翼が生えます。