メタバース 徹底して解るまで その17
さて、いままで説明してきた6つの定義はメタバースの定義としてチャレンジが試みられており、ゲーム世界ではかなり考えられており、運用の実績もある。だが、これから紹介する3つのメタバースの定義はまだほとんど未着手と言って良い。ここが備わって本当のメタバースとなるのだ。これについて説明を続けていきたい。
7) Synchronous
(この定義7も、まえの定義6とともに、議論が込み入っていて、またメタバースが登場していない状態でなかなか理解が難しい。定義6と同じようにBallの該当の英文をできるだけ丁寧に読解して書き直したのがこのセクションである。)
シンクロナス
私たちは、メタバースにおける仮想世界が、単に持続したり、リアルタイムで私たちに応答したりすることを望んでいるわけではない。共有されたシンクロナスな体験でありたいと考えている。そのためには、仮想世界の参加者全員が、一定時間に大量のデータを送信できるインターネット接続(「高帯域幅」)と、仮想世界のサーバへの低遅延(「高速」)かつ連続的(持続的かつ中断されない)接続(行きと帰りの両方)を持っている必要がある。
回線の能力とスピードはめまぐるしく改善されており、5G6Gといった高速回線の導入もそれほど先の事ではない。だが、回線を高速にしたところで
シンクロナスなオンライン体験の実現は現状では難しいと言うことである。現在のインターネットは同期的(シンクロナス)な共有体験のために設計されたものではない。メッセージやファイルの静的なコピーを、ある当事者から別の当事者(つまり、一度にひとつずつアクセスする研究所や大学)に共有できるように設計されている。と知ると、非常に限定的なことのように聞こえるが、、今日のほとんどすべてのインターネットを使ったオンライン体験では機能している。
たとえば、ユーザーは、常に更新されるFacebookのニュースフィードやNew York Timesの選挙ライブフィードなど、ライブのウェブページを閲覧して、多くのユーザーと経験をシンクロさせていると信じているが、実際には頻繁に更新されるページを受信しているだけなのだ。
インターネットプロトコールが実行されているとき、次のようなことが起こっている。まず、ユーザーの端末は、ブラウザやアプリを介して、FacebookやTimesのサーバーにリクエストを行う。サーバーは、そのリクエストを処理し、適切なコンテンツを送り返す。このコンテンツには、一定の間隔(例えば5秒ごとや60秒ごと)でサーバーに更新を要求するコードが含まれている。さらに、これらの送信(ユーザーのデバイスまたは関連するサーバーからの)は、受信者に到達するまでに異なるネットワークを通過する可能性がある。これは、ライブで継続的な双方向接続のように見えるが、実際には、一方通行で経路が異なり、ライブでもないデータパケットのバッチに過ぎない。同じモデルが、私たちが「インスタントメッセージング」と呼ぶアプリケーションにも当てはまる。ユーザーとその間のサーバーは、実際には固定データを互いにプッシュしているだけで、情報要求(メッセージの送信や読み取りレシートの送信)のために頻繁にPingを打っているだけなのだ。
Netflixでさえ、「ストリーミング」という言葉や、「途切れることのない再生」という宣伝が、コミュニケーションがシンクロナスに行われていることを示唆しているが、実際には非連続的に動作している。同社のサーバーはユーザーに個別のデータ バッチを送信しており、その多くはサーバーからユーザーまで 異なるネットワーク経路を経由している。Netflixは、多くの場合、ユーザーが視聴するより前にコンテンツをユーザー側に送信している。一時的な配信エラー(特定の経路が混雑していたり、ユーザーが一時的にWi-Fi接続を失った場合など)が発生しても、動画は再生され続ける。このように、Netflixのアプローチは、連続的な配信でありながら、連続的でない仕組みをいれることで、連続的であると感じられるように作られている。
Netflixには、ほかにも仕掛けがある。例えば、Netflixは、視聴者に提供される数ヶ月前から数時間前までに放送用の動画ファイルを受け取る。この時間帯に、機械学習を用いた広範な分析を行い、フレームデータを分析することで、どの情報を削除してファイルサイズを縮小(または「圧縮」)することができるかを決める。具体的には、同社のアルゴリズムは、青空のシーンを「見て」、視聴者のインターネット帯域が突然低下した場合、500種類の青色の濃淡を200、50、25に簡略化できると判断する。このストリーミング配信の分析では、文脈に応じた処理も行われます。例えば、会話のシーンは、テンポの速いアクションのシーンよりも圧縮に耐えられることが分かっている。さらに、Netflixはローカルノードにコンテンツをプリロードします。Netflixで放映された「ストレンジャー・シングス」の最新エピソードをリクエストすると、実は数ブロック先にあるため、すぐに届くのだ。
上記のアプローチは、Netflixが非同期型のエクスペリエンスであるために機能するもので、ライブで生成されるコンテンツに対しては「事前処理」を行うことはできない。このため、CNN や Twitch などのライブ・ビデオ・ストリーミングは、Netflix や HBO Max などのオンデマンド・ストリームに比べて、信頼性が大幅に低くなっている。しかし、ライブストリーマーにも、それなりの仕掛けがある。たとえば、送信は通常2~30秒遅れるため、一時的な混雑に備えてコンテンツを事前送信する機会が残されている。また、CMを挟むことで、コンテンツプロバイダーのサーバーとユーザーの双方が、前回の接続が信頼できないことが判明した場合に、接続をリセットすることができる。ライブ映像の多くは、CNN のサーバーからユーザーへの一方通行の連続接続しか必要としない。Twitch のチャットのように双方向の接続が必要な場合もあるが、共有されるデータはごくわずか(チャット自体)であり、映像に直接影響を与えないため、重要ではない。
現在どんどん敷設されている高帯域幅、低遅延、継続的な接続を必要とする高度で高速なネットワーク接続を必要とするオンライン経験は、リアルタイムレンダリングのマルチユーザー仮想世界、つまりメタバース以外にはほとんどないと言って良い。
もっとも、最近登場しているZoom、Google Meet、Microsoft Teamsなどのビデオ会議ソフトウェアでは、多くの人が高解像度のビデオファイルを、一度に受信・送信し、共有体験に参加している。だが、このような体験はソフトウェアソリューションによってのみ行われていて、多数の参加者がても、リアルタイムレンダリングを行っているわけではない。
Zoomコールでは時々、パケットの到着が遅すぎたり、まったく届かなかったりして、一言も二言も聞き取れなかったり、自分の言葉が他の参加者に聞こえなかったりすることがある。それでも、我々は内容を理解し、通話を続行することができる。Zoom では、聞き逃したパケットを送信し、再生を高速化し、一時停止を編集して、「ライブ」に追いつくことができる。こうしたことが可能なのは、ビデオ会議が、多くのユーザーが協力して主導する共有のものではなく、一人の人間に焦点を当てた共有の体験であるためなのだ。あなたが発言者だった場合に接続のトラブルが起きても、あなたがいなくても、他の参加者が参加するか、全員があなたの再参加を待って、十分に通話を続けることができるのがリモート会議の特徴である。ネットワークの混雑により、あなたや他の人が何が起こっているのか聞き取れなかったり、見えなかったりした場合は、Zoomは、最も重要な音声を優先するために、通話中の様々なメンバーからのビデオのアップロードやダウンロードを停止する。
一方メタバース、つまり仮想世界ではビデオ会議寄りの高いパフォーマンスがコンピュータに要求され、より複雑なデータセットが送信され、すべてのユーザーがコミュニケーションを始める。ビデオ通話のように1人のクリエイターと数人の観客で構成されるのとは異なり、仮想世界は多くの参加者を共有するのが一般的である。したがって、誰か一人がいなくなると、(どんなに急であっても)全体的な体験に影響を及ぼす。また、あるユーザーが完全にいなくなったわけではなく、他のコールとの同期が少しずれてしまった場合でも、仮想世界に影響を与える能力を完全に失ってしまう。
FPS(ファーストパーソン・シューティングゲーム)を想像してみよう。プレイヤーAがプレイヤーBから75ミリ秒遅れた場合、プレイヤーBがいると思われる場所で銃を撃つかもしれませんが、プレイヤーBとゲームのサーバーはプレイヤーBがすでに退場していることを知っています。このような矛盾があるため、仮想世界のサーバーは、誰の体験が「真実」(つまり、すべての参加者にレンダリングされ、継続されるべき)であり、どの体験が拒否されるかを決定しなければいけない。ほとんどの場合、遅れた参加者の体験は拒否され、他の参加者が先に進めるようになる。メタバースは、その中で多くの人が相反する(そして無効になる)経験をすると、人間の存在のためのもう一つの空間として本当に機能することはできない。
シミュレーションごとのユーザー数に関する計算上の制約(次の定義で説明する)は、ユーザーがあるセッションから切断すると、二度とそのセッションに戻ることができないことを意味する。この場合、そのユーザーだけでなく、友人たちも、一緒にプレイを再開したい場合は仮想世界から退出しなければならず、そうでなければ、そのユーザー抜きでプレイを続けなければならない。ここでゲームの経験が中断される。
つまり、NetflixやZoomのユーザー個人にとっては、遅延や遅れが不満かもしれないが、メタバースにおいては、遅延の問題は、個人を仮想死の危険にさらし、集団を常に不満の状態にしてしまう。これがシンクロニシティの課題である。
この課題にどのように対応するかは、今後数十年にわたってメタバースがどのように進化し、成長していくかを理解する上で非常に重要となる。メタバースは、VR ヘッドセット、ゲーム エンジン(Unreal など)、Roblox などのプラットフォームのようなデバイスのイノベーションに依存すると考える人は多いが、もっとも重要な要素はネットワーク機能であり、どのような接続が、いつ、誰のために可能なのかの問題がもっとも重要な課題となるのだ。
単純で、安価で、迅速な解決策は存在しない。新しいケーブルインフラ、無線規格、ハードウェア機器、さらにはボーダーゲートウェイプロトコルなど、インターネットプロトコルスイート(TCP/IP)の基本要素に対するオーバーホールも必要になる可能性がある。
たとえばBGPというプロトコールがある。これは相互通信を行うインターネットを使った通信において、通信を行うパケットのあて先を正確に把握し、維持するものである。パケットのあて先を正確に把握し、維持していくための技術を経路制御と言い、経路制御を行うためのプロトコルを経路制御プロトコルと呼ぶ。その中でも代表的な経路制御プロトコルがBGP(Border Gateway Protocol)である。
Ballはこれを次のように説明している。このプロトコルは私たちの周りのあらゆるところにあり、さまざまなネットワークでデータがどこにどのように送信されるかを管理する、デジタル時代の交通警備員のような役割を果たしている。BGPの課題は、静的で非同期なファイルを共有するという、インターネット本来の用途のために設計されていることだ。BGPは、送信するデータ(電子メール、ライブプレゼンテーション、リアルタイムレンダリングの仮想シミュレーションで仮想砲撃をかわすための一連の入力)、その方向(受信または送信)、ネットワークの輻輳に遭遇した場合の影響などを、理解しないばかりか、知ることもできない。その代わり、BGPはトラフィックをルーティングするために最短経路、最速経路、最安経路(一般的には最後の変数が優先される)を重み付けしている。したがって、たとえ接続が維持されていても、不必要に長い(潜在的な)接続であったり、リアルタイムで配信する必要のないネットワークトラフィックだったりすると、それを切断することがある。BGPはインターネット技術タスクフォースによって管理されており、改訂することが可能である。近い将来、グローバルにスケールアップしたメタバースでは、BGPを大幅なアップデートする必要があり、それでも不十分な可能性がある。
BGPはほんの一例だが、メタバースで通信をシンクロさせるためにインターネット時代のプロトコールの大幅なアップデートが必要となっていくのである。
さて、ここではメタバースをネットワーク回線の視点から定義をしている。これは実際にサービスプロバイダー達がかなり練り上げていて、映像の転送の技術など、びっくりするレベルになっている。5G6Gと無線も高速化するなかで、同期(シンクロナス)の技術は来るべきメタバース社会の要請にこたえるところまできていると判断しても良い。
さて、メタバースとは何かの定義がここから難しくなる。
8) Unlimited Users and Individual Presence
無制限ユーザーと個人の存在感
スティーブンソンは正確な年代を明言していないが、『スノウ・クラッシュ』におけるさまざまな言及は、この小説が2010年代半ばから後半にかけての時代であることを示唆している。スティーブンソンのメタバースは、地球の約2.5倍の大きさで、「ニューヨークの2倍の人口が常に存在する」。スティーブンソンの架空の「現実世界」に住む約80億人のうち、合計1億2000万人がメタバースのプロトコルを処理できるほど強力なコンピュータにアクセスし、好きなときに参加することができる。しかし、我々が生きているいま2022年において、現実の世界では、このようなことは実現できていない。
現在のメタバースで個人のプレゼンスが保証されているのは、表面積が10平方キロメートル以下で、共有シミュレーションで50人から150人以上のユーザーが利用できる環境で、それを維持するのは困難である。ただし、この世界でビジネスをおこなって成功しているのがゲーム会社である。たとえば、Epicが運営し、強力なコンピュータ装置で動作する非永続的な仮想世界であるゲーム、Fortniteでは、150人の同時接続ユーザー(CCU)が、十数種類のアイテムを使用し、数十種類のダンスや操作を行い、数十階建ての複雑な構造物を構築できる詳細なアバターを制御できる。「フォートナイト」のマップは約 5kmあるため、一度に出くわすプレイヤーは 10~20 人程度である。
2020年にはフォートナイトの中で、トラヴィス・スコットのコンサートが行われた。
これはフォートナイトのソーシャル体験として行われたものだが、狭い場所に多くのプレイヤーが集まり、建築などの多くのアイテムやアクションが無効化され、コンピュータの作業負荷を下げた。Epic Games社は、このライブコンサートに1250万人以上が参加したと報告しているが、いろいろな出来事が起こったと言われている。
またゲームプレイの特徴から多くのプレイヤーが参加してシンクロニシティを経験していたEVEOnlineでは2021年、EVE史上最大の戦闘が発生した。それまでの記録の2倍以上の規模であり、インペリウム派閥とPAPIと呼ばれる敵の連合との間の約7カ月にわたるエスカレーションの頂点であった。Eve Onlineを提供しているCCP Games社のサーバーは1つのシステムに現れた1万2000人のプレイヤーに対応しきれなかった。そして、戦いは決定的な勝利者を生み出すことはできなかった。プレイヤーの約半数は星系に入ることができず、入ったプレイヤーの多くは煉獄のような状態に置かれた。ゲームにログインしても、まとまったコマンドを入力する前に破壊され、退出すれば、サーバーの場所が敵に奪われ、味方が破壊されてしまうかもしれなかった。最終的な勝者はインペリウムだったが、非常に混乱したゲーム経験をユーザーに提供することとなった。
ユーザー数の制限をかけないで、かつユーザーが自己のみならず他者のプレゼンスを確認できるか、はメタバースの基本的な問題の1つで、単位時間あたりに処理、レンダリング、同期しなければならないデータ量が指数関数的に増加するため非常に難しくなっていく。誰も触ることのできない、信じられないほど豊かな仮想世界をレンダリングすることは難しくない。さらに、プレイヤー(この場合、視聴者)がこのレンダリングされたシミュレーションにインターアクティブに関わっていくことがなければリアルタイムで継続的に接続したり同期する必要はない。だが、メタバースでは何人ものプレイヤーが同時に動き、レンダリングされた世界に関わり、自己のみならず他者のプレゼンスも実感しなくてはいけない。この「定義」は現状の説明ではなくて、向かうべき方向を示している。
メタバースは、ユーザー機能、世界のインタラクティビティ、永続性、レンダリング品質などに大きな譲歩をすることなく、多くのユーザーが同じイベントを、同じ時間に、同じ場所で体験できる場合にのみ「メタバース」になる。もし、スポーツの試合、コンサート、政治集会、博物館、学校、ショッピングモールなどに50~150人しか参加できなかったら、それは生きた社会の出来事とはいえない。
現状の技術では「現実世界」の密度と柔軟性を再現するには程遠い。そして、しばらくはこの状態が続く。Facebookの2021年メタバース基調講演で、Oculus VR(Facebookが2014年に買収してメタバース変革をスタートさせた)の元、現在はコンサルティングCTOのジョン・カーマックは、「もし2000年に誰かが私に『今のシステムの100倍の処理能力があったらメタバースを構築できるか』と尋ねたとしたら・・・」とつぶやいている。と聞かれたら、イエスと答えただろう」。しかし、21年後、彼はメタバースは少なくとも5年から10年先のことであり、このビジョンを実現するためには「深刻な最適化」のトレードオフがあると述べた。
この定義をもったメタバースの実現が大きな目標となるべきなのである。
9) What's Missing from This Definition(: Data structure )
さて、最後の定義はデータ構造である。ここは「今までの定義の説明にかけていたところ What's Missing from This Definitionと題されていている。曖昧な表現だ。だが、web3の方向性とblockchainの使い方に対して非常に明確に発言しており、何が欠けているか、それはデータ構造の定義だと述べている。メタバースのおけるあるべきデータの構造を定義が必要だと主張しているのだ。込み入った話なので、詳しくBallの議論を追いかけていきたい。
ここまでBallが説明してきたメタバースの定義をまとめておくと
「大規模で相互運用可能なリアルタイムレンダリングされた3D仮想世界のネットワークで、事実上無制限の数のユーザが同期して持続的に体験でき、個々の存在感を持ち、アイデンティティ、履歴、資格、オブジェクト、通信、支払いなどのデータの連続性があるもの」である。
この定義には"分散"、"Web3"、"ブロックチェーン "という用語が抜けている。それには理由がある。Web3とは、Google、Apple、Microsoft、Amazon、Facebookといった巨大なアグリゲーター・プラットフォームではなく、独立した開発者やユーザーを中心に構築された、やや曖昧に定義された未来のインターネットを指す。これは、今日のインターネットをより分散化したもので、多くの人がブロックチェーンによって実現できると信じているものである。
メタバースとWeb3はどちらも、今日のインターネットの「後継国家」であるがその定義はまったく異なる。Web3は、3D、リアルタイムレンダリング、同期的な体験を直接的に必要としない。メタバースは、分散化、分散データベース、ブロックチェーン、プラットフォームからユーザーへのオンラインのパワーや価値の相対的なシフトを必要としない。とはいえ、メタバースとWeb3は同時に発生すると思われる。メタバースの隆盛にはWeb3の原則が欠かせない。メタバースは、独立したユーザー、開発者、スタートアップ企業によって構築される。また、web3の導入はメタバースの健全性と将来性にとって重要なものとなる。また、中央集権的なサーバーモデルではほぼ無限で持続的な世界規模のメタバースをサポートできるない。メタバースに必要なコンピューティング・リソースを提供する唯一の方法は、個々に所有し、対価を支払うサーバーやデバイスの分散型ネットワークである。
Ballの定義をもう一度、まとめて整理しておく。
メタバース定義
彼の定義とそれにともなう筆者が考える設計要件を説明する
1)Virtual Worlds
(複数の)仮想世界の要件を定義する
2) 3D
3次元仮想世界を設計し実装する
3) Real time Rendered
リアル世界での人や人の行動等を仮想世界にリアルタイムに反映する
ここまでの定義は最近のメタバース展示会で、いろいろなところがデモをやっていてわかりやすい。だが、まだ彼の定義は続く。つまり今展示されているほとんどのメタバースはここまでしか出来ていない。
次に
4)Interoperable Network
複数の仮想世界間を接続し相互利用可能にする
5) Massively Scaled
大規模である
6) Persistance
仮想世界と現実世界人や物が繋がっている(連続性、相互影響)
7) Synchronous
仮想世界と現実世界の人や人の活動やその結果、環境等が同期する
とくる。ここまで出来ているメタバースはまだでてきていない。が、プロジェクトレベルでは発表されている。ここを押さえないとメタバースにはならない。
そして、まだある。
ここからが本番。
8)Individual sense of presence
3つのプレゼンス概念(物理的、社会的、自己)が担保される
9) continuity of data (一応、頁番号を書いておく。p57)
とある。
この9番目は非常に大事で
情報の連続性が保たれているとは
・アイデンティティ(私が私であること、記憶、技能、行動など)
・歴史(過去の活動、結果など)
・身分(会社や社会の中での役割、他人との関係性など)
・モノ(人の周りにある物体、環境)
・会話と会話を成立させるためのプロトコル(規約、ルール)
・価値交換(通貨、ポイント、行為の対価)
実際には8)と9)はブロックチェーンをつかって開発することが必要となり、7)はTCP/IPを拡張するプロトコールを提案していかなくてはいけない。最後の三つの定義を実装できないことにはメタバース社会は到来しないのである。
What's Missing from This Definitionつまり8)までの定義でふれなかったことはデータの継続性というメタバースの最後の定義である、とうわけだ。技術的には拡張するTCO/IPとブロックチェーンである。
以上がBallのメタバースの定義である。これからメタバースの取り組もうとする企業や組織は、いま開発しているものがこの定義のどこまでを含んでいるのか。そして9の定義まで到達するロードマップがあるかどうかをしっかりと検討する必要がある。
さて、次の章は「次のインターネット」と題されている。次の覇者は誰であるか、の予言なのでなかなかスリリングだ。
(この項 終了)
この記事が気に入ったらサポートをしてみませんか?