画像生成AIは電子ウキヨエの夢を見るか?
杉ライカ(ダイハードテイルズ)
画像生成AIは電子ウキヨエの夢を見るか?
こんにちは,ダイハードテイルズ(DHTLS)の杉ライカです.DHTLSは商業出版だけでなくクリエイター自身のSNSもまた重要な作品発表の場と捉え,オンラインに軸足を置いて活動し続けているプロのクリエイターグループで,自作小説や翻訳小説などを,インターネット上で連載したり,各種出版社から書籍としても発刊してもらっています.
ここでは,最近登場したtext-to-imageの画像生成AIサービス「Midjourney」を,自分たちのTwitter連載小説でどのように活用しているか,またそこから何を感じたかなどを,簡潔にレポートしてみたいと思います.まず,Twitterで小説といっても想像しにくい方も多いかと思いますので,DHTLSがどのように小説を連載したり(図-1),AI描画の挿絵を投稿したりしているのか(図-2),具体的なツイート例を紹介します.
前提としてのオンライン連載小説の特徴
オンライン連載小説は,一文をSNSなどに投稿した瞬間から物語とそれに対する反応が始まり,世界中で共有されるわけですから,とても自由でフットワークが軽く,またITの恩恵を活かしやすい,エキサイティングな創作ジャンルです.
一方オンライン小説は,過酷でエクストリームなジャンルともいえます.広大なインターネットこそが掲載誌なので,新たな読者を獲得するために,ネット上の耳目を常に集め続ける必要があるからです.さらに小説はテキスト情報なので,それ単体では視覚的インパクトに乏しく,SNSで注目を集める上での根本的な弱みを抱えています.
こうした背景をまず踏まえ,Twitter連載小説「ニンジャスレイヤー」でMidjourneyをどのように活用しているのか紹介していきます.
興味をひくイメージイラストや挿絵として
まず分かりやすい例として,「マニガン」です(図-3).これはガトリングガンと仏教のマニ車を組み合わせた重火器で,「撃てば撃つほどマニ車ユニットが回転して功徳が得られる」というものです.「ニンジャスレイヤー」に登場し,敵組織が使用する武器の1つです.
プロンプトの入力から一発で画像生成されるのではなく,何度かの掘り下げ試行や取捨選択を行って,最終的な出力物へとAIを誘導していきます.それでもトータルわずか数分で「マニガン」の画像はできあがりました.
この画像を,小説内での設定をちりばめたテキストとともにTwitterに投稿したところ,とてもよくバズりました.バズから小説シリーズ全体に興味を持ってくれた方もいます.とにかく小説を読んでほしいDHTLSとしては大きな成果ですし,将来的に漫画やゲームや映像作品でマニガンを出すときには,これをそのまま参考画像にできますから,アセットも増えて一石二鳥です.
つまりこの画像は「なんとなくAIに描かせたらカッコイイ絵ができたので,それにテキストを付けてみた」というものではなく,元々小説作品内に登場していたアイテムについて「AI描画に向いていそうだし,挿絵にしたらバズりそうだぞ」と明確に考え,プロンプトを練って,意図的に描かせていったパターンです.
このように書くと「作者→AI→読者」という一方的なアウトプットが行われているだけで,従来の画像作成ソフトを使って出力したのと同じ結果に思えるかもしれませんが,実際はそれだけではありません.「作者⇆AI→読者」というキャッチボールが発生することもあるからです.
AIとの創造的なキャッチボール
まず作者側としては,抽出したいイメージが最初から頭の中にあるわけですから,それをAIが理解しやすい適切なプロンプトに翻訳して,できるだけイメージに近い画像を求めます.ところがAIは時々,作者の想像していなかったエリアにまで,より詳細なディティールを追加してくることがあります.
出力イメージが狙ったものから外れすぎていると,単純に作品全体のブランド力やクオリティ低下に繋がるので,どんどん没にしていきますが,「これはこれでアリかもしれない」「むしろ面白いかも」と思えるものが混じっていた場合,それを採用したり,それに沿うようにプロンプトを書き換えたり,あるいは作品側で新たにディティールや設定を追加したりする可能性があります.
たとえば「マニガン」でいうと,銃座らしき部分については小説作品内で登場しておらず,そのため設定もなく,プロンプトでも特に指定されていませんでしたが,今回AIが描画してきたのは黒漆塗り仏具のような風情のある銃座でした.これは作者から見ても大変面白いアイディアだったので,もしかすると次に登場するときには,このようなディテールが追加描写されるかもしれません.
「マニガン」は公開済みの小説から挿絵目的で採ったAI描画の題材でしたが,未公開の作品について,重要なシーンや登場人物のコンセプトアートなどをAIに描かせてみて,そこからさらに作者側でアイディアを広げ,小説本文の描写に手を加えるといったことは,十分起こり得ると思いますし,DHTLS内ではもう実際に行われてもいます.あるいは単純に,AIが「突飛な発想」をくれることもあります.
スシが好きそうなニンジャ
「不意に生まれたAI成生物から,作者側が驚きと刺激をもらう」簡単な例も挙げておきます.これはMidjourneyを使い始めた初日の作品です(図-4).
顔の液晶画面らしきものにスシが映された,近未来のニンジャ.見るからにスシが好きそうですね.これなどは完全に画像生成AIとの共作で生み出された,半分偶然性を持つアートといえます.顔の部分がスシになっている絵なんて,思いつかないでしょう.元々のプロンプトは「サイバーパンク風の屋台で寿司を食べているニンジャ」といった穏当なものでした.
ただ,これも画像生成AIが一発で生み出したのではなく,何世代か試行を繰り返していったところ,顔にスシらしきものが現れてきたものであり,人間側が「この可能性を掘り下げていけば何かが出てきそうだ」という直感に基づいて世代を深めていなかった場合,生まれなかったわけです.また生み出された絵に「これはスシが好きなニンジャだ」という意味や文脈を付与するのも人間側の仕事になります.
どのように出会い,使い始めたか
「マニガン」はMidjourneyを使い始めて1カ月くらい経ってからの作品なので,そもそもどういった経緯でAI描画を使い始めたのか,もう少し遡ってみます.
元々DHTLS全体として画像生成AIに興味を持っていたので,Twitterのタイムライン上でMidhourneyの商用β版がリリースされたことを知ると,すぐに全員で触ってみました.第一印象として感じたのは,まず面白いということ.「これはシーケンサーが音楽に使われ出したときのようだ!」という知的興奮もありました.
また,誰にでも簡単に操作はできるものの,一定以上のクオリティのものを安定して出力しようとした場合,明確なダイレクション,取捨選択,プロンプトの言語化の巧みさといった技術が必要になる,とても創造的な行為だとも感じました.
そして「仮に使いこなしたとしても,こちらの意図したものを100%精確に描き出すことはできない.だが抽象性を上げれば,小説の挿絵としてかなり良いものができるだろうし,何より描画速度が速い!」という意見と驚きで一致しました.ただ,これがほかの人から見ても十分面白いものになるのかどうかは,未知数でした.
そこで試しに,初日の2,3時間ほどで作った最初の数枚の画像(図-4含む)に,作品世界の解説に適切と思われるキャプションを付けてTwitterに投稿してみたところ……それが物凄くバズり,ITMediaなどにも取り上げられたので,大いに手応えをつかむことができました.
おそらく歴史上初めての試みの数々
そこから本格的にプロンプトやAIの癖などを手探りで学んでいき,以前から挿絵化したいと思っていた部分や,イラスト化したかった登場人物などを順次AIに描画させ,Twitter上で発表していきました(図-5).これらも初の試みとして,ITMediaなどに取り上げてもらいました.
中でも,開始から数日のうちに最もバズったのが,図-6の挿絵「黄金立方体の浮かぶネオサイタマ」です.
これは近未来のサイバーパンク都市ネオサイタマ,そのマルノウチ・スゴイタカイビルの上空に,神秘的な黄金立方体が出現しているという,小説内のワンシーンです.文脈を踏まえて,宗教画のような荘厳かつ壮大な構図で,誇張された,抽象的なイメージで出力しています.ここは固有名詞も多く,なかなか想像しにくいシーンなので,ごく短時間で挿絵化できたことに驚きました.
嬉しいことに,こうした挿絵画像によって大勢の人から「なんだ,ニンジャスレイヤーというのは,こうした壮大なSF作品でもあるのか」とイメージを掴んでもらい,小説への興味を持ってもらうことができました.Twitterのフォロー数や,試し読み記事へのアクセス人数も,ここから大幅に増えています.
小説とAI描画アートの相性の良さ
図-6の「黄金立方体の浮かぶネオサイタマ」をTwitterでパッと見て,「SF小説の表紙みたいだな」と感じた方も多いのではないでしょうか.実際昔から,小説作品の表紙や挿絵には,ある程度抽象的な絵や写真が用いられることが多いです.読者自身のイメージを邪魔せず,想像を広げるのに役立つと考えられるからです.
一方で,絵がまったくゼロだと「舞台設定が突飛すぎて何も想像できない」というデメリットが強くなります.特にSFなど,未来の世界が舞台の場合,都市風景やその世界観をイメージするのが困難です.エンタテインメント小説はより多くの人に読んでもらい,より売れなくてはいけないという側面もありますから,イメージを思い浮かべにくいというのは明確な弱点になります.仮に無料にするとしても,注目を集めて興味を持ってもらわなくては,そもそも読んでもらえません,
つまり小説の作者としては「より多くの人に読んでもらうために挿絵や表紙画像をつけたい,ただ,できれば,ある程度は抽象的にして,読者の想像力を固定するのではなく刺激するものであってほしい」という我儘な思いがあります.
そうしたニーズに対し,コンセプトアートのような画風を得意とする画像生成AIというのは,非常にうってつけでした.また挿絵だけでなく「キャラクタ」についても,AIの画風や絵柄を2つか3つ指定して並列すれば(図-7),読者のイメージを程よくバラつかせたまま明確化できますので,これも向いていると考えました.
作業の効率化やクオリティアップにも
作者側が画像生成AIの操作に時間を取られると,肝心のテキストを執筆したりする時間が減ってしまうのではないか,と思う人もいるかもしれませんが,トータルで見た作業時間はほとんど変わっていません.
というのも,今までも自分たちのオンライン小説用の挿絵,表紙絵(ページであればバナー)などには,著作権フリーのハイクオリティ写真素材などを使用したり,それらを少し加工したりして使用してきた経緯があるからです.
SF作品のイメージに完全合致する写真というのはまず存在しないため,適切な素材を探したり加工するのに多大な時間を要することもありました(もしくは妥協してきました).そこへ「AIですぐに作る」という選択肢が加わりました.これは可能な限りテキスト作業に時間を費やしたい者にとって,実にありがたいことです.
「製作時間の節約」や「クオリティの向上」について言うならば,もう1つ別な利点もあります.それは書籍化やメディアミックスなど,より長い制作時間を設けられる大型のプロジェクトにおいてです.
イメージ共有のための中間翻訳物として
DHTLSではオンライン上で作品を発表して直接マネタイズするだけでなく,出版社を窓口として書籍や作品も作っています.そのようなときは,絵を描いていただく外部の別なクリエイターさんや別分野のデザイナーさんと,視覚的イメージを共有する必要があります.
そうした打合せの際に「この登場人物のイメージは何かありますか?」「この場面のイメージ元となっている参考映像などはありますか?」「この書籍の装丁イメージはどんなものがいいですか?」といった質問を受けることが多々あります.
クリエイターユニット内ではすでに体験として共有できている膨大な作品群があったとしても,それを外部と素早く端的に共有するというのは,これまでのところ,とても難しかったです.視覚的なソースによって何かを伝えようとするときに,ボトルネックが発生しがちでした.画像生成AIは,これを解決する「イメージを円滑に橋渡しするための中間翻訳物」「中間生成物」として,とても有用だと思います.
現在のAI描画は,精度はまだ低い分,物凄い速度で多数のバリエーションを生み出してくれますから,その中から最もイメージに近いものをピックアップして,次の創造的工程の人に受け渡す,ということが実現できるようになりました.DHTLSでは以前からこうしたAI技術への強いニーズがあり,今回ようやく,「誰でも手の届く使いやすいツール」として登場してくれたという形です.
この「一握りのプロしか使えない高価なもの」ではなく,「誰でも手の届くもの」というのも,DHTLSが重要視した部分です.なぜなら大勢の読者がそれを使って,ファンアートなどの創造的な行為に参加しやすくなると考えたからです.
ファンアートへの影響はあるのか
画像生成AIの登場は,既存のファンアートやファンコミュニティに,どんな影響を与えるでしょうか.
DHTLSの活動は,大勢の読者やファンアート作成者,そして広がり続ける創造的で温かいファンコミュニティによって支えられています.このため当初から「我々の各小説作品については固定された唯一の公式イメージを持ちません.読者が自由にファンアートを描いてほしいからです」というスタンスを貫いてきました.
また「ニンジャスレイヤー」シリーズでは,Twitter上の感想タグ「#ニンジャスレイヤー」とあわせ「#ウキヨエ」というファンアートタグを活用しています.ここには毎日,世界中の読者からたくさんのファンアートが届けられています.
そこで試みに,最新の小説連載に登場するキャラクタのイメージ画像(図-8)をAI描画し,何パターンか発表したところ,それに着想を得たファンアート投稿が増えて,にぎやかになりました.従来通り,自分の考えた自由なイメージでそのキャラクタを描いている読者もいますから,単純に点数が増加した形になります.
ゼロから新規にキャラクタをデザインして絵にできる人の割合というのは,そこまで多くありませんから,画像生成AIで「とっかかりの仮デザイン」「コンセプトイメージ」のようなものを数パターン提示するというのは,新しいテクノロジーを活かした,オンライン小説ならではの表現方法になるのではないかと思います.
また,AI描画を行えるのは作者側だけではありませんので,ファンアートとしてAI描画イラストを投稿する読者も増えました.このファンアートタグではMidjourneyに限らず,Stable Diffusionも含め,さまざまなAIが使われています.ある読者が作成したAI画像から着想を得て,別な人が手描きのCGファンアートを描くといった事例も見られ,これもまた創造力のリレーに寄与しているといえます.
これまでも上記のような事例はありましたが,稀なものでした.「他の読者がデザインしたキャラクタを,自分の絵柄や解釈でもって描く」というのは,やはり心理的な敷居が高いと思いますが,その点,AIが作ったデザインというのは,相手に必要以上に気を遣わず,創造力のリレーを行いやすいのかもしれません.
DHTLSでは少なくとも,画像生成AIによってファンアートが致命的なダメージを受けたり,シーンの雰囲気が悪くなったりすることはなく,むしろファンアート作りに参加できる人やアウトプットの総量が増えて……最終的には以下のように,AIを仲介して,相互のインタラクションがより活性化されるのではないかと考えています.テックとは仲良く共存していきたいです.
今後の展望として
実際に画像生成AIを使ってみると分かりますが,それ単体で仕事として成立するレベルのAI画像を安定して描き続けようとするならば,広範な芸術分野の文脈のストックを持ち,かつAIプログラムの性質も熟知している必要があります.ですから,従来のアーティストの仕事がなくなるとは,あまり思えません.
むしろ,今までそうした知識の組合せやイマジネーションを有していたのに,手を巧く動かして絵を描くことができなかった人や,あるいは身体的理由からできなくなってしまった人が,これによって創造的な活動に加わることができるはずです.もちろん,ある程度の画像処理やレタッチの技術を持っていれば,作業効率は明確に上がりますから,自分の手で絵を描けるというアドバンテージも依然として存在するでしょう.すでにIPを持っている人や,これから強力なIPを構築しようとしている人にとっては,AIはそれを加速させるとても頼もしい技術になると思います.
画像生成AIはまだまだ新しい分野で,不安視されている部分などもありますが,運用するのは結局人間ですし,コミュニティや文化がそれを補強してくれますから,きっと良い方向に活躍し,発展していくものと期待しています.またそもそも「AIとの対話」という新しい試行錯誤が楽しく,クリエイターグループとして,大きな刺激になっています.こんなにも楽しくエキサイティングな技術を生み出してくれて,ありがとうございます!
(2022年9月13日受付)
(2022年10月12日note公開)