見出し画像

なぜ、メタバースの実現は2030年以降なのか?

なぜ、メタバースの実現は2030年以降になるのか?
 (4月24日复旦大学EMBAの交流会にて、テンセント副総裁マー・シャオイーの講義内容翻訳版)

 
このような機会をいただき、メタバースについて皆様と共有し、議論することができ、大変光栄に思います。
最近話題のメタバースですが、振り返ってみると、決して新しいものではありません。
 
 
1997年に「ウルティマオンライン」というゲームがあり、当時は「世界が継続的に動いている」というコンセプトを導入していました。 誰もオンラインで交流に参加しなくても、ゲームの世界は存在し続け、進化し続けるというものでした。 このコンセプトは、すでに現在のメタバースの考えと完全に一致しています。
 
実は、1995年から1998年にかけて、さまざまなインターネット企業が事業を開始し、人々が生活のシーンや人間関係をいかにオンライン化するかを考えていた時期とほぼ同じなのです。
 
最も新しい試みは、2006年頃に開始された「セカンドライフ」というゲームです。 ちょうど2カ月前、当時立ち上げたチームに、当時の心境を聞いたことがあります。 彼らのビジョンから、そのゲームこそが、今話題のメタバースだったのです。
 
 
メタバースという言葉は、1992年の小説に由来することは周知の通りですが、ビジネスの世界で最後に言及されたのは2018年、アメリカのアナリストが書いた記事で、そのタイトルは「What is Tencent's dream anyway(テンセントの夢とは何か)」でした。
 
記事では、テンセントがEpic Gamesに投資した理由、Roblox、Reddit、Snapchat、そしてさまざまなコンテンツやプラットフォーム系の企業に投資した理由を分析した......とある。 これらのレイアウトをまとめたとき、「メタバース」という言葉がこれ以上ないほどぴったりだ」と感じたそうです。
 
その後、Robloxの登場により、FacebookはMetaと名前を変え、これはますますホットなコンセプトへと変化しています。
 
なぜ、このような初期のコンセプトが、今になって急に話題になっているのでしょうか? 昔と比べると、ここ数年でいろいろな変化が起きているからでしょう。
 
1つは、全体のコンピューター演算能力が臨界点に達したということです。 2016年にVRの波があったとき、当時はもう少し保守的で比較的悲観的でしたし、業界の多くの方とお話した結果、大規模に使えるVRデバイスで本当に良い体験をサポートするために必要な技術は成熟しているとは言い難いと感じていたんです。
 
一例を挙げると、当時のモバイルコンピューティングチップは高解像度ディスプレイに全く対応できておらず、バッテリーやディスプレイデバイス自体の制限と相まって、体験が貧弱になってしまったのです。
 
2つ目は、重要な新技術がなかったことです。 最近この部分が気になり、多くのキーとなる関連技術や、ウェア部品の生産の進捗状況まで見てきました。 すでにいくつかのロードマップが明らかになってきており、今後数年のうちにこれらのキーテクノロジーのブレークスルーが見られると思います。
 
第三に、私自身にとって重要なことですが、インターネットの普及率も臨界点に達しています。 特にこの2年間の世界的な流行で、在宅勤務が主流になりつつあることがわかります。もしあなたがテクノロジー企業で、社員に在宅勤務の選択肢を提供しないのなら、その魅力は失われていると言えるでしょう。 人々はオンラインで物やサービスを買うことに慣れているので、テンセントビデオ、ニフティすべてのオンラインビデオを見ることが容易になり、人々は最新の映画やテレビをそれで見ることに慣れています。 このような部分から、より多くの人が自分の生活の大部分をオンラインで公開することを望んでいるのです。
 
最後に、ユーザーの立場から、需要の観点から見てみましょう。
 
ご存知のように、人類という種の最も重要な特性は、多くの人が協力してあることを成し遂げる「協調性」であります。 社会全体が複雑化すればするほど、必要な技術も複雑化していきます。 このようなニーズそのものが、何らかの技術で対応できるチャンスがあると社会が判断すれば、非常に大きなブレークスルーを達成する原動力となるのです。
 
以上のことから、2006年のセカンドライフの最初の試みは明らかに早すぎたと思いますし、2015年、2016年のVRの第一波の時点でも、早すぎたと思います。
 
 
今日までに、もしかしたら、そのようなタイミングがあったのかもしれません。
 
ですから、このカンファレンスでメタバースの将来についての考えを話すのはちょうどいいことだと思います。正直なところ、私個人としては、メタバースの詳細を話すのはまだ早いと思うような、世の中の多くのメディアの報道とは異なる見解を持っています。
 
結局のところ、メタバースはどうあるべきか、何で構成されているのか・・・・・・。 明確かつ正確に定義することは、まだまだ難しい課題です。
 

 
しかし、今のところ、メタバースは、未来のための新しいテクノロジーとアプリケーションを統合する可能な方法であり、人間とコンピュータの相互作用とすべての人のための相互作用の未来に対する想像力の集合体であると考えることができるのです。
 
ですから、今日お話ししたことの多くは、あくまで皆さんとのディスカッションやシェアリングであり、実際に未来がこうなると予測できるとは言い難いのです。
 
全体としての未来を想像する場合、大きく分けて2つの方向性があると思います。実は少し議論があるのですが、元々は全部で3つの方向性がありました。
 
 
1.イマージョン、2.コンテンツ、3.ビジネスモデルの3つです。
 
 
ただ、多かれ少なかれ、メタバースはまだ非常に早い段階だと思いますし、メタバースの定義すら明確でない時点で、ビジネスモデルも非常に可変的で、あまり正確な予測はできません。 ですから、今日はビジネスモデルの話ではなく、没入感のある体験とコンテンツの開発についてお話しします。
 
 
01
 
イマージョン:2030年以降
 
メタバースが普及し始めるかもしれない
 
 
まず、没入感ですが、主に2つの方向性があると思います。
 
 
1. ヒューマンマシンインターフェースとインタラクションの方法
 
2.VRなどのデバイスの体験。
 
 
いまやメタバースといえば、どうしてもVRを連想する人が多いですね。 もちろん、これはFacebookが少し前にこのVRの方向に大きな賭けをしたからということと、メタバースというコンセプトを実現するためには、VRのような全く新しいデバイスが必然的に必要になるからということの2点に基づいています。
 

なぜ? 一般の人がキーボードやマウス、タッチなどのデバイスを使ってコンピュータに入力する情報は、実はコンピュータの技術的な観点から見ると非常に狭い帯域で、非常に限られた情報しか入力できないんです。 コンピュータはこれらを元にフィードバックするだけで、それ以上の情報を直接入力する方法はない。
 
しかし、入力の帯域が広がれば、実際にはもっと多くの次元を追加させることができる。

 
例えば、今のVRの方向性は環境認識をすることですが、VRデバイスにカメラを増やし、センサーを増やして環境情報をコンピューターにも入力することで、コンピューターが何か新しい機能を計算することができるようになるのです。
 
 
別の例として、人体の状態を追跡することができます。 最新技術では、頭の位置や目の向きなど、前後左右上下の6次元の3Dトラッキングが可能になり、周囲とのインタラクションができるようになりました。

 
その中でも特に注目したいのが、手元の操作です。 最新のOculus Quest 2では、まだジョイスティックで情報を入力する必要がありますが、より自然なインタラクションは手を使って行うものだというのが、業界の共通認識になっていますね。
 
 
初期の携帯電話はタッチペンで書いていましたが、アップル社は「それは人間にとって直感的ではない、人間の直感は、指で画面を触ることだ」と言い出し、これはVR機器でも同じことです。 ですから、今、私たちが作っている多くの進歩は、指の動きをとらえることです。
 
 
また、最新の技術では、顔認識や表情の撮影に力を入れています。 人と人がコミュニケーションをとるとき、相手の反応がとても重要なフィードバックになることは周知の通りです。
 
 
例えば、現在のオンライン会議では、人の表情が見えないので、自分が今、速く話しているのか遅く話しているのかがわからず、あまり良い体験ができません。 でも、オフラインだったら、観客の反応をすぐに見ることができますよね。 ですから、将来的には顔認識を使ってリアルタイムに人の表情を追跡し、それをバーチャルなシーンに投影することも必要です・・・・・・。
 
これらの新しい入力方法が統合されることで、情報の帯域幅が広がり、コンピュータへの情報入力を劇的に変化させることができるのです。
 
 
第二に、非常にエキサイティングな技術的な発展もあります。
 

 
例えば、先日はVRヘッドセットのディスプレイユニットに注目しました。 Oculus Quest 2を試したことがある人なら、Fast-LCD技術を搭載していることをご存知でしょう。 しかし、この技術には問題があり、それは「スクリーンドア効果」です。 目に近づけすぎると、まるでスクリーンを覗いているかのように、目の前に画素のドットが見えてしまうのです。 これは実は、かつての携帯電話の低解像度ディスプレイと同じなのです。
 
 
その後の話は、ご存知の通り、iPhoneが成功した大きな理由のひとつは、iPhone 4でRetinaスクリーンという概念を導入し、誰もが携帯電話の画面を使うという体験を大きく向上させたことです。
 
 
VRは進化しており、これらの課題を解決するための新しい技術が生み出されています。 例えば、すでに生産ラインに入っているのは、VRヘッドセットに十分な解像度を持つ4K解像度のシリコンベースの有機ELディスプレイです。

 
ここで一つのコンセプトを述べると、「VRヘッドセットでレティナスクリーン効果を実現するには?
 

現在では、人の視野角1度に対して何画素のドットがあるべきかという規格があります。 大雑把に言うと、30ですでに画素の境界が感じられなくなり、60あたりまでいくと、画素のドットが全く見えなくなってしまうのです。
 
 
つまり、4Kシリコンベースの有機ELディスプレイは、誰にでも非常に良い体験をしてもらうのに、十分すぎるほどの性能を備えていることがわかります。
 
 
輝度も、VRヘッドセットの変化点です。
 
 
現在のシリコンベースの有機ELディスプレイから、将来はより高輝度を実現するマイクロ有機ELディスプレイまで。 以前は、液晶の輝度は大体400~500GT程度でしたが、今は2000GT、今後の開発のロードマップを見ると、すでに1万GTのデバイスが開発されているようです。
 

 
これは、表示装置を強化し、ユーザーの没入感を高める技術という非常に大きなボトルネックを解決するものです。 また、定評のある製品も発売されています。
 

しかし、今後はもう一つ非常に重要な開発方向があり、それは光路を折りたたむ技術です。

 
これまでのVRデバイスを思い出してみると、VRデバイスは通常、厚くて重くて大きく、頭に装着するのに非常に違和感があることがわかります。 これが大きなボトルネックになっていました。 将来的には、折りたたみ式の光路デバイスが登場し、VRヘッドセット本体が非常に薄くなり、一般的なメガネをかける感覚に近づけることができるかもしれません。
 
 
また、VR/ARの議論にもブレークスルーがあり、VRはすべてのコンテンツがディスプレイユニットからやってくるが、ARはコンテンツと実環境が重なり合い、組み合わされなければならないとしているのです。
 
 
現在、業界の誰もが行っているのは、フォールデッド・ライトパス・ソリューションです。ディスプレイですべてのコンテンツを表示しながら、外界にセンサーを追加してユーザーの周囲をとらえ、最終的にディスプレイにオーバーレイ表示するものです。 来年の初め頃に、AppleがVR/ARのエフェクトに折りたたみ式の光路ソリューションを用いた、そのようなデバイスを出すという噂があるんです。

 
多くの人が入ってくれば、全体として非常に良い結果が得られると信じています。 そして、将来的には、現在の電話やパソコンに比べ、もっと画期的な進化を遂げたものが、誰にでも手に入る日が来るでしょう。
 
 
まとめると、ヒューマンマシンインターフェースの技術ロードマップは、非常に明確に発展しつつあるということです。 さまざまな制約がある電池を除けば、ほぼすべての分野で解決策があり、現在も進行中です。
 
 
だからこそ、メタバースであるVR/ARの発展に確信が持てるのです。
 
 
もう一点、この技術の経験を十分に生かすには、機器内部のハードウェアのサポートだけでなく、ソフトウェアの開発が必要です。

 
なお、この場合のソフトウェアは技術であって、コンテンツではないことに注意が必要です。 3つの次元に煮詰めました。
 
 
1. 信じられる環境:メタバースのシナリオは、ユーザーがこれが現実の世界であると信じられるように、よりリアルになってきている。
 
 
2.信頼できるキャラクター:人は社会的な生き物であり、私はグループと交流し、コミュニケーションし、協力する必要があります。 私は、集団で対話し、コミュニケーションし、協力する必要がありますが、最も必要なのは信頼で きるキャラクターです。 皆さんもある程度はご存知かと思います。
 
 
ここ数年、流行によってテレビ会議にも慣れてきましたが、オフラインの会議ほどしっかり議論されていない課題も多く、どこか違和感を覚えたのではないでしょうか? あるアイデアを面と向かって話すと、相手の賛成・反対の表情、反対・賛成の感情が見えてきて、「これは生身の人間が話しているんだ」と実感できるんです。 しかし、今のテレビ会議は、画面に向かって話しているわけです。

 
そして、これは当然ながら、3点目にも及んでいます。
 
 
3.信頼される交流:まだオンライン会議の話ですが、ディスカッションというよりプレゼンテーションのような形式で、オフラインの人が議論の中に自分を挿入してぶつかり合うということがありましたが、今のオンラインにはそれがない。

 
もっと本格的なやりとりをしようと思えば、十分に信憑性を持たせるために、いろいろなディテールが必要です。 例えば、水のボトルを取ってもらう、握手をしてもらう、その温度や重さを感じる、これら全ては、従来のコンピューターやパッドでは全くできないインタラクションです・・・・・・。 しかし、今、この分野で大きく進歩した技術があります。
 

 
結論から言うと、技術の発展に伴い、メタバースやVR/ARを行う企業に多くのツールを提供すると同時に、人々がより信じやすい世界やキャラクターの関係を作れるよう支援する必要があります。
 
 
02
 
コンテンツの量:誰が十分な量を提供するのか?
 
 
これはかなり大きなテーマです。 メタバースに入れるべきコンテンツがまだわかっていないからです。 しかし、今見ると、私たちはいくつかの次元で考えることになります。
 
 
1.専門的な内容、2.汎用的な内容。
 
 
この部分については、私はもっと悲観的になります。 なぜなら、これらの技術はロードマップ上で開発中ではあるものの、いずれも準備に時間がかかるからです。
 

なぜなら、ある技術がまだ極めて重要でない場合、それは例えばゲームや映画、テレビといった比較的特殊で専用のアプリケーションであることが多いのに対し、誰もが使っている携帯電話のような汎用的なカテゴリーでは、今や何千通りもの使い道があるからです。

 
ユニバーサルに特化すると、もっと時間がかかる。
 

 
自分を褒めることになるが、実際に社内のチームと話をするときは、だいたい2030年を基準にして、それまではメタバースは専用フェーズ、それ以降は汎用的な状態に移行して既存のパソコンや携帯電話の利用シーンに挑戦し始める機会がある程度ある、ということです。 今はどちらかというと、新しい補完的なシナリオの位置づけですね。
 
 
専用機と汎用機の違いについては、ここでもう少し詳しく言う必要があるかもしれません。

 
1ヶ月半ほど前にEpic GamesのCEOであるTim Sweeneyとミーティングをして、この話になったときに、今やっているゲームは「ゲーム」であり、動画を見るときは「動画」でしかないが、メタバースは違う、メタバースで「生きる」べきだ、という結論に達しました。 この2つには根本的な違いがあります。

 
例えば、オンラインシネマに行くと、現実から切り離された専用の世界が広がっています。 しかし、Metaはこのバーチャルな世界にみんなの生活を統合し、一体化させることです。 だから、そこに住みたくなるくらいのコンテンツが必要なんです。
 
 
この十分な内容は、いくつかのルートに分けて考えることができます。

 
1.PGCのプロフェッショナルな制作。例えば、Tencentのような会社は映画、ゲーム、テレビシリーズを制作しており、これはプロの制作です。 PGCは今でもメタバースの非常に重要な部分なのです。
 
 
2.UGC、すなわちユーザーが作成したコンテンツ。
 
 
3.現実と想像の融合 今、現実世界と仮想世界を統合する多くの技術についてお話しました。
 
 
この3つの要素は、いずれもコンテンツの重要な構成要素です。
 
 
では、どうすれば実現できるのでしょうか。

 
まず、大規模なPGCの内容については、最近、いくつかのブレークスルーがありました。 新しいゲームを追っている人には、少し前にEpic GamesがMatrixの発売と同時に仮想都市を作るという非常に印象的なデモをやっていましたね。

 
ポイントは、街を走るクルマにそれぞれの動きがあること。信号で止まる、人が止まるのを見る、3万人の市民の服装や行動、見た目がそれぞれ違う--従来なら、この規模のバーチャルワールドを作るのは不可能に近かったはずです。

 
しかし、今日、技術の発展とともに、一方では技術力が高まり、他方ではこれらを解決する良い方法が増えてきているため、これらの不可能が徐々に達成されつつあるのです。

 
例えば、Epic Games社とは、2つのプロジェクトを進めています。 AIで現実世界を取り込むことが可能なプロジェクトです。 ニュージーランドの10平方キロメートルの渓谷に行き、そこで7000~8000枚の写真を撮り、その写真をエンジンに取り込むと、エンジンが渓谷の90%をだいたい再現し、さらに我々の手で微調整を加えて、短時間で非常に大きな世界を生成し、しかもそれが非常にリアルに見えるのです。
 
 
もうひとつ、私たちが行ったプロジェクトは、中国の「Siren」というバーチャルヒューマンのプロジェクトで、その後、Epic Gamesからも「Meta Human」という非常にリアルな人間がリリースされました。 それは、先ほど述べた「バーチャルワールドでは、信じられる人間が重要な構成要素になる」というコンセプトに帰結します。
 

また、従来であれば、アバターを作るのにかなりの時間がかかっていたはずです。
 

皆さんも聞いたことがあるかもしれませんが、ハリウッド映画の多くはアバターを作るのに何ヶ月もかかり、10年代の映画をオンラインでレンダリングするには何ヶ月もかかります。しかし、現在の技術では、ハリウッドが4ヶ月かかるものを、我々は0.01秒でレンダリングでき、前者の95%の品質を達成することができるのです。

 
これらのことから、大規模生産へのアプローチが可能になります。 これにはモーションキャプチャーのようなコンテンツも含まれ、AIが加わることでより簡単に作品を作ることができるようになります。
 
 
次にUGC側ですが、これは実は外から見ると多かれ少なかれ違う見方をしている部分なんです。

 
例えば、対外的にはUGCというと、重要なのは分散化ということですが、この点については、RobloxのCEOであるDavidとかなり交流があり、我々は2015年頃からRobloxに長く関わり、かなり多くの投資をしています---UGCコンテンツの成功の鍵について話すとき、私たちは二人ともコミュニティの原則、透明性、そして特に秩序と地位を維持する部分について言及しますが、これには強力な中央集権的執行が必要です。
 
 
しかし、外部の意見に反対というわけではありません。 私は、分散化とは能力の分散化であり、中央集権的なプラットフォームなしに、ユーザーが自分たちのコンテンツを作るためのツール、能力、リソースを提供することだと考えています。 このコンテンツを支えるのは、先ほども申し上げたように、継続的で原則的、かつ長期的に安定したプラットフォームです。 これがUGCを作る上で最も重要なポイントだと思います。
 

そして3点目の現実との融合は、先ほどのメタバースやVR/ARの技術に大きくさかのぼります。 実は、私たちが目指すゴールは、これまでのインターネットや人間社会の取り組みと一致しているのです。 人間は常に、飛行機や自動車など、物理的な制約を取り除き、物理的なロスを短縮し、大量共同作業の効率を高めたいと考えてきたのです。
 
 
つまり、長期的に見れば、メタバースとは、物理的な境界を取り払うために、より外部の現実世界のサービスやコンテンツをいかに取り込んでいくかということなのです。
 

 
例えば、今日はテンセントの会議を使って情報を共有していますが、実際の効果は復旦大学のオフラインの教室でのコミュニケーションには確実に及ばないと感じており、相互作用によって情報の伝達はより良いものになるでしょう。 ですから、将来機会があれば、メタバース・テンセント・ミーティングを開催し、もっとリアルな人たち、リアルなシナリオを見てもらいたいと思います。 これらはすべて想定内のことです。
 
 
もう一つの例はオンラインコンサートで、ご存知の方も多いと思いますが、以前フォートナイトでは1000万人以上がオンラインでコンサートを聴くことができるイベントを実施しました。 記録的なことだった。
 
 
そして、ゲーム全体をより良い体験にするために、もっと新しい技術を導入できないか、実はスポーツ界の多くの人たちと話をしていて、eスポーツはそれを考えてきました。
 
 
つまり、物理的な距離などに制限されている現実がまだたくさんあり、仮想化による効率化が急務なのです。 メタバース、VR/ARの開発には、多くのチャンスがあると思います。
 
 
 
03
 
より現実的な問題
 
最後に、メタバース、VR/ARの問題点についてお話したいと思います。
 

 
今の話は一見楽観的ですが、私自身は心の底では少し悲観的に考えています。
 

普段、私は人と話すときに、「1〜3年後の短期的な視点で見ると、私は他の人よりも悲観的で、10年後の長期的な視点で見ると、私は他の人よりも楽観的で、これらの新しいテクノロジーのシナリオは人類社会全体に大きな変化をもたらすと考えています」と話しています。

 
私が知る限り、今これらの技術が大規模に利用できるようになるのは2025年から2027年の間ですが、ロールアウトするのはまだ2030年でしょう。 それは、私が考えているタイムラインです。
 
 
簡単な例として、価格は重要な参考資料です。 例えば、先ほどの4Kシリコンベースの有機ELディスプレイは素晴らしい体験ができますが、たった1台のディスプレイの価格が、Oculus Quest 2全体の価格と同じになるくらい高価なものなんです。 ですから、価格が下がるには長い時間がかかるでしょう。
 
 
第二に、ビジネスモデルそのものにまだ問題があることです。 先ほども言いましたが、まだ早いんです。
 
 
現在のステージを過去の歴史と対応させると、2つのポイントがある。
 
 
1.ユニバーサルデバイスの普及。
 

ここにいる多くの若い人は知らないかもしれませんが、実は最初の家庭用専用機は1977年に発売されたゲーム機「アタリ2600」で、これは今のOculus Quest 2にベンチマークされかねないものなのです。
 

一方、身近な存在であるIBM PCは1981年に市場に登場した。 家庭用PCが本格的に普及したのはWindowsが登場してからで、最初のバージョンは85年、バージョン3.0の大規模展開は92年、より広く知られたWindows95はすでに95年である。
 

このように、このプロセスには少なくとも6〜10年の開発期間が必要でした。
 

2.ビジネスモデルの確立。
 
 
2つ目の例は、インターネットです。 実際、インターネットが登場したのは90年ですが、テンセントやグーグルなど、私たちが知っているインターネット企業は98年に設立されたばかりです。 そして、これらの企業がビジネスモデルを確立したのは、2004年頃だったでしょうか。 その過程にも同じように長い年月がかかりました。
 

ですから、短期的にはメタバース全体としてまだ数年の育成が必要ですが、育成の方向性は明確で、ポテンシャルも非常に高いと思います。
 
 
この20年間のインターネットの人間社会、経済、技術への貢献は誰の目にも明らかですから、今後20~30年の間に、メタバースという核となる統合されたインターネット体験が、社会全体にさらに大きなインパクトをもたらすと信じています。
 

そして、探索、コラボレーション、ドライブのポイントは、まだまだたくさんあるはずです。

この記事が気に入ったらサポートをしてみませんか?