覆面作家がバーチャル人体を2週間で錬成する

2021年4月28日 19:42

私はいわゆる覆面作家であり、本名や顔、年齢等をネットで公開していない。

といっても「その正体一切不明！」とかいう本格覆面（？）ではなく、普段 Twitter で自分の考えや作品の着想経緯をべらべら喋っている。平均的な小説家よりも吐き出している内心の量は多いと思う。「小説家は作品のみを世間に発表するべき」という人からすると、相当に邪道な部類だ。

では何に覆面を被せているのかといえば、自分の身体性である。もう少し言えば、自分の意思や選択の及ばない、主に遺伝などの先天的な要因で決まる特性のことだ。

私は自分の意思で何かを作ることに偏執する人間である。それなのに、先天的要因で構成される身体が自分の「窓口」として扱われることが、どうにも受け入れづらいのである。（自由意思も結局は遺伝や環境で決定されるのでは？とかいう哲学議論はここではしない）

対照的に、自宅の写真などはとくに抵抗なく公開している。この部屋は私が自分で決め、自分で選んだ家具を置き、自分の読んだ本を書棚に並べている。身体よりもよほど「自分の一部」という感じがするのだ。

さて、このたびSFマガジン6月号「異常論文特集」なる号に自作品を寄稿したところ、監修者の樋口恭介さんが YouTube で寄稿者の座談会をやりたいと言い出したため、突貫工事で3Dモデルの人体を構築することにした。配信日は2週間後である。

実在の人物が3Dモデルの皮を被って動画などに出演する文化は、2019年頃から急速に流行してきている。いわゆるバーチャル YouTuber、略して VTuber である。初音ミクなどのバーチャルなキャラクターと異なるのは「中の人」の人格が強調されていることで、そういう意味では「演じるべきキャラクター」というよりも「衣服」のイメージに近いように思う。

衣服と言ってしまうと重要性を低く見ていると思われるかもしれないが、VRでアインシュタインのアバターを被るとテストの成績が上がるという冗談みたいな研究成果もあるらしく、「衣服」は決して馬鹿にできたものではない。外見を自由自在に制御することは、遺伝子に束縛された身体を超越し、自己をありたい形に展開することにつながるはずだ。これは私の価値観に合う。

ということで、まずは3Dモデルを構築する。キャラクターデザインは前から決まっており、私がときどき書く漫画に登場する。立方体を組み合わせた頭が人体から生えているような構造だ。

モデリングソフトは Blender を使う。なんとなくこれが一番定番なイメージだからだ。「オブジェクトの選択に右クリックを使う非常に癖のあるソフト」と聞き及んでいたが、最近のアップデートで左になったらしい。

おそらく世の中には「パーツを組み合わせるだけで君だけのバーチャル人体が作れる！」なツールがあるだろうし、2週間という時間制限ならそれを使う方がいい。映像研の金森氏ならばそう言うし、ここまで読んだ諸兄にそう思った者もあるだろう。だが私の場合は「目的があってそのために作業をする」ではなく「作業を楽しむために目的をでっちあげる」なのでその理屈は通らない。ぶっちゃけ Blender が習得できればモデルの出来はどうでもいいのだ。

以下この記事は有識者から見れば「○○を使ったほうが便利ですよ！」な部分が山ほどあるだろうが、私は利便性や効率化にあまり関心がないので、そういうアドバイスをもらうとゲーム攻略のネタバレをされたような気分になってしまう。そのところはご了承いただきたい。

【1日目】立方体オブジェクトの移動、回転、伸縮などの基本操作を覚え、ひとまず人体らしきものを作ってみた。「夏休み」「図画工作」「よくがんばりました」といったワードが浮かんでくる造形になった。

【2日目】いきなり人体錬成は敷居が高いため、まず身の回りにある単純な形のものをモデリングした。マテリアルを貼って色をつける、Boolean で差分をとるなどの手法を覚えた。これだけで百均の雑貨なら結構作れるようになる。

【3日目】テクスチャや文字を貼る、Bevel で角を丸める、などを身に着けた。昨日まで角を丸めるために円柱を4分割して Boolean していた自分がアホに思えた。これが成長である。

【4日目】基本操作を手になじませるために、我が家にある一番複雑なメカ、すなわちアイリスオーヤマの掃除機を作った。5時間くらいかかった。左右対称なモデルを作る Mirror modifier を知らなかったので左右で同じ操作を2回やった。

【5日目】前日の疲れで集中力が切れそうなので「Blender 勉強中です」と世間にアピールするためにバズりそうなものを5分で作った。バズった。

「そば湯の容器って初心者が作った3Dモデルみたい」というツイートを見たので実作してみた。 pic.twitter.com/dUvMhglejL
— 柞刈湯葉（いすかり・ゆば） (@yubais) April 16, 2021

私もクリエイター歴が長いので「苦労して作ったものよりも数分で作ったものの方がバズる」という法則にはすでに慣れきっているし、むしろ「苦労したからこそ数分でバズるものが作れるようになった」と解釈している。

【6日目】アニメーション習得のために、私の知るもっともアニメイティヴな民芸品を作った。

3Dモデル化しやすい偶蹄類 pic.twitter.com/5sdUUX3x6M
— 柞刈湯葉（いすかり・ゆば） (@yubais) April 17, 2021

とてもよい。永遠に見ていられる。

【7日目】休憩。世界を創造する者は7日目に休まねばならない。

【8日目】モデリングは一旦脇に置いて、声を作ることにした。これはボイスチェンジャーとボイスロイドの2系統を用意して、どちらを使うかは直前で判断することにした。

私は Mac ユーザーなので、ボイスチェンジャーは Mac 標準の音楽編集ソフトである GarageBand を用いた。やり方はこちらの記事を参照。音域を変えて5系統くらい用意した。

しばしば思うのだが、オンライン座談会ではひとつのスピーカーから全員の声が聞こえるため、いま誰が喋っているのかわからなくなりがちだ。となれば、相手が男性であればこちらは女性声を、相手が女性ならばこちらは男性声を、という人がいてもいいのではないか。むろん声を自分のアイデンティティと考える人は受け入れられないだろうが、私にそういうのはない。

変換した声をリアルタイムで Zoom に流すには、GarageBand の出力を Zoom の入力につなぐ必要がある。これには BlackHole という仮想オーディオソフトを用いた。ユーザー登録が必要なので少々尻込みするかもしれないが、メールアドレスと名前を入れればすぐダウンロードが始まる。

ただ、これだけだと変換した声が Zoom だけに流れて自分で聞こえなくなってしまうので、BlackHole への入力を別途スピーカーに流す必要もある。これは LadioCast というのを使った。

ためしにリアルの友人と Zoom で会話したところ、「全然違うトーンなのに確かに君が喋ってるとわかるね」という感想だった。やはり音域とは別のところに人の声のクセというのが出るらしい。

【9日目】続いて、テキストから音声を合成するボイスロイドも使ってみることにした。入力したテキストをそのまま喋ってくれるソフトウェアだ。こちらは Mac 版が存在しないため、Parallel Desktop 版の Windows 10 を使用した。

安く済ませたいなら Mac 標準の音声読み上げ機能や、ニコニコ動画文化圏で有名な「ゆっくり音声」などがあるのだが、ボイスロイドが気に入ったのは「東北」を名乗るキャラクターが3人いることだった。有史以来これほど東北地方が尊重されるのは初めてではないだろうか。というわけで「東北きりたん」を購入。

（ところで冒頭で「先天的な要因を公開したくない」と言ったわりに、私の出身地が福島県であることはかなり軽率に公開している。これはやや複雑な理由だが、身体と違って出身地は本質的に過去だからというのがある）

テキストを入力して「再生」ボタンを押せば声が出るので、この出力先を先程の BlackHole につなげれば、ボイスロイドで Zoom 会話ができるようになる。今回は Windows 仮想環境をまるごと BlackHole につないだ。

ただ、相手が喋るたびにこちらがタイピングしては会話が成り立たないので、「そうですね」「ありがとうございます」などのよく使うセリフはあらかじめ音声ファイルに出力して、クリックひとつで呼び出せるようにする。このインターフェースは HTML5 の <audio> 要素で作った。下図のようにブラウザとボイスロイドを並べる形だ。

特に、間違って何かを言ってしまった時に「いまのは言い間違いです」というセリフをボタン化しておけば、操作ミスに慌てずに対応することができる。

調声としてはデフォルトより「速度」を上げて「抑揚」を下げ、少し機械っぽい声にした。身体性のない声のほうが今回の目的に合っている気がするからだ。

これも友人相手に練習したところ、相手が喋っていることに相槌を打つだけなら、事前登録したボタンだけでほぼ対応可能だった。そして、こちらが何かを喋る場合は、先に原稿を用意して、タイミングを見計らって右側のボイスロイドに流し込む、という具合だ。

ただ、こちらが原稿を喋ってる途中に相手が口をはさんできた際、スムーズに「停止」ボタンを押しづらくて混乱しがちだ。ボイスロイドのUIをユーザーがいじるのは難しそうなので、よりAPI的に使える合成音声ツールがあれば乗り換えるかもしれない。（今回の配信のまさにその日に CoeFont STUDIO というのが公開されて話題になったが、まだ試していない）

さて、会話しやすさではボイスチェンジャーの方が適切だが、今回はこちらのボイスロイドシステムを使うことにした。もともと登壇者が多くて私の発言機会が少ないので十分対応できそうなのと、身体性を覆面するという点でこちらの方が優れているからだ。

ただ実戦に臨んだ印象として、他の登壇者に比べて声が異様すぎるせいで、私が喋りだすと全体の会話の流れをぶった切ってしまう（ような気がする）ことが多々あった。合成音声による会話自体は可能性というか面白みを感じたので、よりシームレスに口を挟めるシステムを考えていきたい。

【10日目】いよいよ人体を構築する。Blender の人体3Dモデルの構築に関しては Yonaoshi3D さんの YouTube 講座が非常に参考になった。「再現性を重視する」という姿勢が科学的で素晴らしいし、収録時にちょいちょい赤ちゃんの声が混入しているのもいい。とはいえ全部履修する時間がなかったので、指や足などは作らず最小限の骨格だけを作った。初代プレステにいそうなキャラクターになった。

正方形の頭部と円形の首が意外とシームレスに接続できたので満足。世の中の3D人体がデフォルトでこのポーズをしているのは、体が xyz 軸に沿っている方がモデルを作りやすいかららしい。今回実作してはじめて理解した。何事も経験である。

【11日目】構築した人体にボーンを入れ、ポーズを調整して椅子に座った。机の上にいままで作った小物を置けばにぎやかで楽しそうだが、Zoom としてリアルなカメラアングルにすると机が映らない。

Blender の composite 機能を使って、昔撮った写真を背景に合成した。Zoom ではバーチャル背景という機能があり、アニメや映画のワンシーンを背景に自分を映すことができるが、これは人体がバーチャルで背景がリアルという逆理構造だ。

【12日目】最後に、この人体に動きを加える。一般的な VTuber であればこの人体にモーションキャプチャやフェイストラッキングを使って中の人の挙動を追従させるのだが、ちゃんとやるには機材が必要なものが多く、残り2日で実行するのは難しそうだ。

とはいえ、座談会で用いる動きはせいぜい「うなずく」「手を振る」「コーヒーを飲む」程度なので、あらかじめ数パターンのアニメーションを録画して、それを手動で切り替えることにした。Web カメラを使わないので、手違いで中の人が映ってしまう事故も防げる。

先述したとおりボイスロイドは声が目立つので、他人の話に「そうですね」などと無難な相槌をしようとしても会話をぶちきってしまう。動画で頷くだけならそういうことがない。

OBSというストリーミングソフトに登録して、仮想カメラを起動する。こうするとこの動画があたかも外部カメラのように認識され、Zoom 側でそれを呼び出すことができる。

この OBS は音声の扱いもできるが、先述のとおり音声は Windows 仮想環境から直接 Zoom に投げ込むため今回は使用しない。

本当は音声と動作を連動させる、つまり「同意」系のセリフボタンを押せば頷くようにしたかったのだが、そこまで手が回らなかったので、手動で別々に動かす形にした。

なお配信環境の都合で、登壇者はほぼ静止画になってしまって挙動は YouTube Live にはほとんど送信されなかったようだが、Zoom に同席いただいた皆さんにはちゃんと私がコーヒーを飲むさまが見えていたようだらしい。よかったよかった。

全体構成を図にまとめるとこのようになる。突貫工事で作ったのでかなり複雑怪奇なことになってしまった。次の機会があればもっとスマートにまとめて、音声と挙動が連動するようにしたい。

ところで、もしかしたらこれを読んだ各出版社の担当編集さんや同業者さんが誤解されるかもしれないので一応補足する。私が「身体性に覆面をかぶせたい」と思っているのはあくまで「私をよく知らない人に対して、身体が最初の窓口になるのが嫌」という意味である。インターネットという場に身体を公開するとそうなるのは避けられないが、私の小説を読んでおり、継続的に私と仕事をする相手であれば、素顔を見せることには何ら抵抗はない。なので「打ち合わせで寿司を食べましょう」と言われたら秒でOKする。私に寿司よりも優先すべきポリシーは存在しない。（現状のなんとか禍が落ち着いたらですが）

人体錬成については以上だが、そもそもこの配信はSFマガジン・異常論文特集の販促が目的なので、そちらについて触れたい。

私の寄稿した「裏アカシック・レコード」は、言語として可能なあらゆる嘘が収録されたデータベース〈裏アカシック・レコード〉へのアクセスが可能になった世界で、それを歴史的デマの検証に用いたり、ビットコインの売買に利用したり、国家機密を暴いたりする。小説らしい登場人物はほぼ登場せず、裏アカシック・レコードに対するこれまでの研究成果をまとめたレビュー論文になっている。（理工系にはそういう論文形式がある）

そもそも「異常論文」というジャンルが何なのかは私もよくわかっておらず、おそらく他の寄稿者たちもわからないまま作っているが、こうしたさまざまな視点から立体視的に異常論文概念が形成されていくと予想される。

「人物やストーリーのない設定だけの小説を書きたい」というのはおそらく多くのSF作家（+志望者）にある願望なので、これがジャンルとして確立すればかなりの眠っている才能が掘り起こせるのではないだろうか。読者側の需要がどれだけあるかはわからないが。

私に読めた範囲では難波優輝さんの「『多元宇宙的絶滅主義』と絶滅の遅延――静寂機械・遺伝子地雷・多元宇宙モビリティ」が興味深かった。反出生主義から必然的に導出されるべき、しかし現実の理論としてはいささか真顔で言いづらいものが、SFという舞台を借りて表現されている。

最後に、最近の私の仕事について紹介したい。この春は上述の「裏アカシック・レコード」を含めて4本の短編が出た。

4月14日発売、ハヤカワ文庫・日本SF作家クラブ編『ポストコロナのSF』では「献身者たち」という短編を寄稿した。2030年代ごろの中東を舞台に、MSF（国境なき医師団）の医師を主人公として、mRNA ワクチン技術の将来性、および紛争地での医療や途上国におけるワクチンの不平等性などについて書いている。

20名近い執筆者による重量感のある文庫だが、コロナによって「それまでと全く変わってしまった世界」を描く人と、「おおむね復旧したけれど残った爪痕」を描く人がいるのが印象的だった。10年後くらいに反省会をしたい。私の読書傾向をご存知の方は予想がつくと思うが天沢時生「ドストピア」がよかった。濡れタオルで殴り合うヤクザの話。意味がわからん。

4月6日発売、河出文庫・大森望責任編集『NOVA 2021年夏号』では「ルナティック・オン・ザ・ヒル」を寄稿した。かなり遠い未来、月面の独立国家で行われる地球との戦争を、まるで傍観者のように眺めているふたりの兵士の話。

「月生まれ月育ちの地球に対する劣等感が見事に書かれている」という評価をいただいた。自分はあまり劣等感に縁のない人間だと思っていたがなぜか上手く書けたので、無意識レベルでそういう劣等感があるのか、もしくは小説というメディアがそもそも劣等感と相性がいいのかもしれない。

他の寄稿作では、高丘哲次さんの「自由と気儘」がいい。命令に従うゴーレムと気儘な猫という、人間を中心として真逆の位置にある両者が、主のいなくなった家で生活する模様を対比的に描いている。

3月13日発売、WIRED Vol.40 「特集：地球のためのガストロノミー」には「土なき月の基地の土」という発音しづらいタイトルの短編を寄稿した。月面に所在する大学共同利用法人・低重力研究所（低重研）を舞台とした、月面における食糧生産、およびそれによって必然的に発生する排泄という人類普遍のテーマに取り組んだ宇宙トイレ小説である。

そもそも WIRED って小説が載る雑誌なの？と思ったかもしれない。正直言うと私も執筆を依頼されるまで知らなかった。こちらの特集は食糧生産と環境問題などがテーマとなっている。ぶっちゃけ自動車よりも農業畜産のほうが気候変動へのインパクトが大きいので、電気自動車よりも関心が向けられてほしいテーマだ。自動車を買わない人はいても飯を食べない人はいない。

以上です。あなたの人生にとって何かの参考になれば幸いです。よろしければサポートをください。お願いします。

文章で生計を立てる身ですのでサポートをいただけるとたいへん嬉しいです。メッセージが思いつかない方は好きな食べ物を書いてください。