AIでSFマガジンの表紙をつくったメイキング話
SFマガジンの表紙をAI画像で担当させていただきました。
自分にとってもはじめてのプロジェクトだったので、もろもろのメイキング記録メモ。
きっかけ
Twitterで「AI画像生成のお仕事こないかなー」とつぶやいたら、SFマガジンさんからコンタクトが。
SFマガジンは、中高生の時に図書館で毎号読んでいたので、ビックリ!
一も二もなく引き受けることに。
コンセプト設定
まずはAIで作る表紙って、どういうのにしよう!?という方向性ぎめ。
編集さんとの初期ミーティングでは、「わりと自由にやってもらってOKよ」という言葉をいただきつつ…
あわせてなんとなく「コンピューターおばあちゃん(サイバーパンクな人)」と「ニューロマンサーの表紙(旧版)的なの」みたいな、イメージをいただきました。
ニューロマンサーは、元祖サイバーパンク小説みたいな本。そういえば、ロンドンの大学時代、課題図書の1つがコレ。
みんなが大好きな「財閥!ヤクザ!千葉シティ!」といった、サイバーパンク世界観の元祖です。
あわせて、ヒアリングをしながら、
「アナログっぽいというか、70-80年代SFっぽいのいいですよね」
「AIの特性を生かす」
「サムネや店舗で、ぱっと見のインパクトが強いもの」
「古典絵画技法と、現代的な表現のミックス」
などの、方向性が決めていきました。
そんなこんなで、自分的な最終コンセプトは
「機械と人間が融合した肖像画。絵そのものがチューリングテスト的で、人間が描いたか機械が描いたか曖昧。古典絵画の技法や文脈をのせた現代(80年代)の絵。店舗やSNSで小さいサムネで主題が強く見える絵。なので背景とかは無し」
といった感じに。
こちらの方向で、まずは色々と実験をしてみることに。
縛りルール
さらに追加の縛りルールとして、
・ 生成文 勝負、Photoshop禁止
・現役イラストレーターの名前を、生成文にいれない
・通常のイラストレーターさんと同レベルのフィーをいただく
・通常のイラストレーターさんと同程度以上の工数をかける
などを追加。
フォトショ禁止は、「AIで作る」を明確化するため。
それ以外の縛りは、イラストレーターの仕事を脅かすような文脈ではなく、「表現を拡張するものである」というメッセージを出すためです。
「30秒でポン出しして1000円、イラストレーターいらずです!」みたいな方向で、AI画像が押し出されるのは嫌なので。
ツールの選定
AIツールとして何を使うか、ここではDALL-E2、MidJourney、StableDiffusion、NovelAIなどを候補にあげつつ、最終的にはStableDiffusion(当時はバージョン1.4)を選択しました。
それぞれ一長一短があるのですが… StableDiffusion 1.4が下記理由から最有力候補になりました。
・昨今のAI画像生成ブームの火付け役
・オープンソースである
・プログラムで制御できる
特に、AI画像生成というあり方をフル活用するために、プログラムで制御できる点がポイントとなりました。SFコンテンツっぽいですしね。
基礎スタディ
まずは、ひたすら生成。「アタリ」と思われる方向性を探します。
今回は「遺伝アルゴリズム」的なアプローチを、擬似的にやってみました。
・プロンプトの一部をランダムに置き換える(突然変異)。
・複数のプロンプトを、交叉(ブレンド)する。
という感じで、プロンプトを自動生成しながら、どんどんバリエーションを拡張していくプログラムをざっくり組みました。
擬似的に… というのは、絵の評価を人間が目でやっている為です。絵の評価アルゴリズムを作るのが難しいためですね。
「突然変異」は、「鉄でできた歯車のロボット」みたいな生成文を、ランダムに「アルミでできた」や「工業用のロボット」など、に差し替えていく実装です。
「交叉」は、生成文Aと、生成文Bの2つを、任意の比率でブレンドする実装です。
そういう実装をすることで、自分でも想定していなかった変異が発生するような下地を作ります。
そして、そっからさきはガチャ。ひたすらに。
描き込み量のスタディ
宗教・美術文脈的なスタディ
発散フェーズ
過去に美大で、プログラムによる画像生成の先生をしてました。2年ぐらい。そのころ、生徒の子たちには以下みたいなことを教えていたんですね。
・プログラムは画材にすぎない(人間の意思決定が最後に残る価値)
・自分専用の画材が作れるなら、自分専用の表現が作れる
・表現としてのプログラムの武器は、尋常でない工数を使えること。
特に3番目がポイントで、人間の作業にくらべて、無限の初期スタディ、無限のチューニング、無限の細かい作業ができるのが強みです。
前述のガチャマシーンで何百体も生み出す。レビュー。
そして、プロンプトの構成を変えたり、ランダムに埋め込まれる単語の辞書をアップデート。
このサイクルをひたすら回していきます。
納品フェーズ
最終的には万単位の画像を生成しつつ… そのなかか「一定基準以上」の画像を数千枚選択。そこから一軍の600枚を選び、さらにその中から3枚を選出して、SFマガジンさんにお渡ししました(念のため納品前にGoogle 画像検索で、類似画像を確認しています)。
提出するのは、あくまで「何千パターンの検証を担保にした、数枚のイメージ」です。何千パターン全部見せると収拾つかなくなるので、全部の提出はしません。
個人的には、いわゆる「いい絵」よりも、エッジの立った絵が好きなのですが…
サイバネ表現は人体拘束や人体損壊につながるので、あまりにエッジすぎてても、SFマガジンがSMスナイパーとかに勘違いされてしまうので、そういうのもなくなくボツに。
以下みたいな感じで、最終的に660体の1軍が生まれ、そこから最終候補まで絞り込みました。
おわりに
そんなこんなで、自分的な初のAI画像生成のプロジェクトの忘備録でした。
プロジェクト開始時は、SD1.4とかの時代だったのですが、雑誌が出る頃にはSDは2.1に、MidJourneyもV4まで進化するスピード感。下のnoteを書いてから、まだちょうど4ヶ月しかたっていないのですが… 状況はものすごい速度で変化していきます。
マルセル・デュシャンは、「芸術とは選択することだ」的なことを言っていました(うろおぼえ)。まさにAIによる画像生成は、「選択」という行為が、歪なぐらい強調された制作技法だなと思いました。
引き続き、面白そうな表現ができないものか、色々と模索していけたらなぁと思います。