ひも解かれてきたClubhouseのウラ側について、厳選記事だけを備忘録的にまとめてみる。(最後に驚きあり)

3週目。先週はいよいよ、ルームの質と量が変わってきたような気がする。タレント・芸人・アーティスト等、芸能人系著名人のルームは明らかに減った(非公開部屋に移ってるのかな?)。一方で、特定分野で第一人者だったり、そこで一旗揚げようという野心や意欲のある「意識の高い」方々(自分はプラスの意味で使ってます)は引き続き、積極的に大活用しているイメージ。

定石通りの幻滅期突入! このあとは、ますます急降下で盛り下がる?

どんなサービスも「幻滅期」があるのは特にデジタル系のサービス、アプリなどでは当たり前に言われていること。

画像2

出典:ガートナー「ハイプ・サイクル」 ©2021 Gartner, Inc. and/or its affiliates. All rights reserved.

その筋の第一人者ばかり集まっているClubhouse内だから当然「セオリー的にいえば、このあと配信疲れ・幻滅期が必ずくる」と、1/末最終週の上陸後、盛り上がり最高潮だった最初の週末には既にあちこちで語られていた。

「過度な期待」のピーク期を過ぎて幻滅期に突入したClubhouse。今週来週あたりから入ってくるユーザーは「これのどこが面白いの?」となって、ますます「盛り下がって」いきそう。ある専門家の方の見立てとしては、幻滅期のピークが~5月くらい。啓発期に向かうとしたら夏から秋にかけてで、「安定期は21年後半では」とのこと。息を長く見守ろう。

Clubhouseの音声技術について、ひも解かれ始めてきたので備忘録メモ。

今月は、専門家・専門メディアによるClubhouseの裏側技術ひも解き、が進んでいたので、音声処理のところ中心に、自分の備忘録用にまとめとく。

話題になり始めた当初は、こちら(西尾泰和のScrapbox)だったり

Clubhouseのここがすごい。Zoomとの推定差異から考えてみた(Forbes JAPAN)2/1付」

などで書かれていたように

遅延を減らす努力をClubhouseがどのようにおこなっているか推定してみた。周辺の技術者の間でおこなわれたパケット解析の結果や討議などを鑑みると、ClubhouseはUDPという、リアルタイム性が高く、データを垂れ流しする通信方式を利用して、通信をしていることが推測出来る。

推測するに、裏側で特殊な音声圧縮&送信技術が組まれているようだ」的な話が(あちこちのルーム内でも)でていて、自分もnoteの最初の記事ではそんなことを、書いていた。

その後、技術的にはそこまで特殊なものは使っておらず、ありものをうまく活用しているだけ=逆にそこがすごいところ、といった話がではじめ。

著名人らが連日大盛り上がりの「Clubhouse」 音声技術を丸裸に(日経クロステック)2/9付」

巧妙なサービスデザインやアプリの出来の良さ、操作画面(UI)の造りの巧みさなども雑談を促す特性に影響しているだろう。だがそれ以上に音声データのハンドリングなどにも秘密がありそうだ。
最初に結論を述べておこう。驚くべきことに、Clubhouseは何も特別な技術を使っていなかった。
ClubhouseはWeb音声アプリやオンラインゲームの音声チャットなどで使いつくされた既存技術を組み合わせて全く新しいユーザー体験を生み出している。現在の任天堂の基礎を築いた伝説のエンジニア横井軍平氏の哲学「枯れた技術の水平思考」を、そのまま実践したのがClubhouseの本当のすごみだ

さらには、2/12のスタンフォード大学の発表を受けて・前後して以下のような記事が出て

話題の「Clubhouse」に中国当局へ情報が漏れる恐れ。開発元はセキュリティ強化を実施(Engadget 日本版について)2/15付」

Clubhouseのデータは中国企業Agora社に送られている。スタンフォード大が警告(ギズモード・ジャパン)2/16付」

Twitter上で「Clubhouseのソーシャル音声プラットフォームはどこが開発したんだろうね?」とだれかがつぶやいて、あるエンジェル投資家が「Agoraっていう会社で、先週上場したばかり。Clubhouseはこれをベースに1週間くらいで開発されたものだよ」
Clubhouseが開発したのはUI的な部分であって、Clubhouseの音声プラットフォームを動かしているのは上海Agora社なんです。音声データのホスティングをしているのもAgora、インターネット配信をやっているのもAgora

実は裏側は、Agoraの技術を使っているだけだった

ということが一般的にも広く知られることとなった。

※ 余談だが、上記2つとも、記事をよく読むと「音声データそのものが米国内にあれば中国政府がそれを入手することもできない」「サーバーが米国内なら中国政府からの請求に応じる必要はありません」と書かれている。リアルタイムに第三者がアクセスできた場合等のリスクも含め、あくまで「警告・警鐘」なのに、見出しだけ読んで「どうやら中国に会話内容が送られているらしい」と、SNSやらコメやらあちこちで書かれているのは、いつものことながら辟易してしまう。

その後も、マニアックな分析やナットクの考察が続々と。

その後、裏側がひも解かれてきたことを前提に、さらにつっこんで音声情報の「事前処理」が優れているのではないか等、分析・解析・考察が続いている。

専門家が検証「クラブハウスの音はなぜ良いか  「Zoom」や「Teams」より格段に話しやすいワケ」(東洋経済オンライン)2/18付」

なるほど、音声処理だけに特化し、そこに集中して開発リソースを投入し、差別化を図ったのか。たった4人、エンジニアは3人だけという小さな世帯で、Alpha Exploration(Clubhouseの運営会社)なかなかやるな……と思ったのだが、実は音声コーデックは1種類だった。オープンソースで開発されている業界標準の「Opus」という音声コーデックそのもので、何も特別な技術は使っていない。
要素技術(基本技術)の開発に長けた自社エンジニアで勝負するベンチャーではなく、会話のしやすさにフォーカスを当てたアプリケーション、サービス設計のセンスで勝負する会社と言えるだろう。
同じOpusを採用する音声サービス「Discord」よりも1音声当たりの帯域は狭い、つまり圧縮率はむしろ高い。ではなぜ心地よい音だと感じるのだろう。それは事前処理での整え方が優れているからだ。背景ノイズを抑え、声質を左右する帯域以外の音声情報をフィルターすることで圧縮効率を高め、結果的に声の品質を上げているのだ。

記事では、iPhoneとiPadとの違いや、同じiPhoneでもシリーズによって違う、ヘッドフォンやイヤホンのメーカーによる違い等についても触れており、なかなかにマニアックな世界で興味深い。

また、

Clubhouseのコアは一体何なのだろうってことから考える(note:最首 英裕)2/19付」の指摘にあるような

このくらいのこと、我が国が誇る通信の専門家、NTTとかだったら簡単に実現できるんじゃないの
駄目な理由探ししてたら何もできないじゃん。やるべき理由探しして、それがちゃんとあるなら、カニバってもいいからやるべきだと思う
革新的技術があっても、世の中に革新を起こせるわけではなく。
だれにも負けない技術があっても、だれにも負けないビジネスになるわけでもなく

といった考察は、その通りだなぁ、と思った。

自分でClubhouseを作ってしまう強者も! エンジニアってすごい。

と、ここ数週間の「Clubhouseのウラ側分析・ひも解き」の経過を振り返りつつ、そんな中でググっていて気がついた以下に衝撃を受ける。

Clubhouseも使っているらしいAgoraを使って簡単にビデオ通話(Zenn)1/31付

かなり簡単に試せたんじゃないかと思います。Clubhouseで実稼働しているという情報もついさっき知ったので、実運用しても問題なさそうだなという感触をえています。

Agoraで君だけの最強のClubhouseを作ろう(Zenn)2/3付

Clubhouse に招待されないので自分で作ってみた、みたいな感じです。まあ別に招待してくれなくていいんですけどね、大して興味ないしそのうちオープンになるだろうし

専門家が分析とかメディアが記事化とかしている間に・というかその前に・・・

裏側、とっくに気づいて、さっそく自分で作ってみてるし!!!

自分はコードがまったくかけないので、こういうのみるとホント、羨望でしかない。恐るべし。


追記)

記事公開したら、「3週連続投稿!すごいです!」と褒められた。こういうところ、noteうまいなぁ。

スクリーンショット (285)


この記事が気に入ったらサポートをしてみませんか?