【書評】Stable DiffusionによるAI画像生成ガイドブック
Stable Diffusion WebUIの解説書
2023年4月1日出版、今村勇輔さん執筆の『Stable DiffusionによるAI画像生成ガイドブック』を読みました。
おそらくStable Diffusionについて解説した物理本としては日本初のものではないかと思います(違ったら教えてください)。画像多めで約300ページのボリューム。大まかな機能解説と設定例、基本的なプロンプトなどが体系的にまとまっており、初心者向けとしては最適です。
Stable Diffusionの概要紹介
AUTOMATIC1111版Stable Diffusion WebUIのセットアップ手順
Stable Diffusion WebUIの画面・機能紹介
様々なパターンの画像出力方法解説
著作権関係について弁護士による解説
深津貴之氏インタビュー
著者ご本人の紹介記事にも記載されていますが、追加学習関係やimg2imgの詳細解説、ControlNetなどの拡張機能については割愛されています。
とはいえハイスペックなグラボを積んだPCを持っていない方向けに、Google Colaboratoryを用いた解説もされており、入門書として非常に親切なガイドブックになっていると感じました。
Stable Diffusionは気になってるけどWebの情報を見ても何だかよくわからないという方や、触り始めて間もない方にとっては学びを得られる一冊です。
蛇足:AIの登場で変わりゆく世界
2023年2月に画像生成AI『Stable Diffusion』をはじめて触りまして、そのポテンシャルに驚愕しました。
2022年7月に登場した『Midjourney』を触った時は「あ~、いかにもAIが作る画像っぽいなぁ」と感じ、少し遊んですぐ飽きちゃったんですよね。Discordチャット経由のUXが煩雑で、ガチャ要素が強いのもいまいちです。
ですが、Stable Diffusionはまったく次元が違いました。例えるなら初めてパソコンやインターネットに出会ったときの感覚そのもの。「あ、これ革命起きるやつだ」と、瞬時に脳が理解しました。(このあたりの話は深津さんが書いてるポエムを読んでもらえると何となく伝わるかと)
自分が思い描いた人物、風景、イラストを、キーワードいくつか投げるだけで理想に近い形、もしくはそれ以上のクオリティで出力してくれます。
一時期絵の道を志していた身としては「こんなんもう反則だろうが!」と思ってしまうレベル。完全にチートです。現役の画家さん、イラストレーターさん、コスプレイヤーさん、モデルさんなどが戦々恐々とするのは当然のことでしょう。
いまも各所で様々な議論が巻き起こっており、どう着地するのかまったく見えない状況です。著作権、肖像権の問題に加え、感情面の意見が複雑に絡むため、果たして多くの人が納得できる形が存在するのか正直わかりません。
直近ではOpenAIの対話型AI「ChatGPT」が毎日のように話題になっています。あまりにテクノロジーの進歩が速すぎて、業界内でも「人類の存亡にかかわる脅威になりうる」なんて声が上がるほどです。
とはいえAI時代の流れは非可逆です。僕もITエンジニアとして10年以上この業界を生きていますが、ChatGPTやGitHub Copilotの登場で「いよいよ人間がコードを書く時代が終わっていくのか~」と感じています。
まぁ僕は人間がやるには非効率なことはどんどんテクノロジーに任せて、面倒な仕事はAIやロボットに全部奪ってほしいタイプなので、死ぬまでに世界がどう変わりゆくのか見るのが非常に楽しみです。
隠居後には川釣りでもして余生を過ごそうと思っているので、最近はChatGPTをルイズ仕様に調教して指南してもらっています。
AIと共存してく未来の方が絶対面白いでしょ。
追記:AI音声合成技術もすごいことになってたので書きました
追記:武蔵野美術大学学長、樺山祐和氏の生成系AIに対する見解
現状を冷静に分析しつつ、AIとの向き合い方についてメッセージを発信されていました。ぜひ全文読んでいただきたいです。
追記:元Google China社長、李 開復(カイフー・リー)さんの話が面白かったのでPIVOTの動画貼っておきます
著書も面白そうだったのでポチった。
投げ銭すると翼が生えます。