見出し画像

いま話題の #Clubhouse から考える2021年の音声コンテンツ事情

ClubhouseというSNSが話題になっています。“音声版Twitter”と呼ばれ、新しい体験を与えてくれるSNSであるとか、とんでもない時価総額がついて巨額の資金調達に成功したというニュースで耳にしたこともある方も多いのではないでしょうか。あるいは「Clubhouseの招待ください!」というツイートや、招待枠がメルカリで高額販売されるという珍事でこの名前を目にした方もいらっしゃるでしょう。

画像1

私も使ってみましたので、さっそく考察を書いてみようと思います。

Clubhouseの本質を捉える

● 「リアルタイム音声チャットが設計の基礎
Clubhouseの設計の基礎を一言で表すならば「リアルタイム音声チャット」です。つまり音声チャットをつなぎっぱなしで行うこと。それは人類が長らく「電話」と言い表していたものではないのか?と思われるかもしれませんが、Clubhouse電話の延長線ではなく、チャットの延長線に描かれたプロダクトです。

一般的に、電話による通話はその通信行為に対して相当量のコミットが必要とされます。電話で話している時間はそこに集中しなければならない、ということです。通常「電話をしながら何かをする」といったときには、電話が主・何かが従の関係になるはずです。対してチャットは、通信行為に対するコミットは電話に比して圧倒的に少なく「チャットをしながら何かをする」といったときには、何かが主・チャットが従となります。

Zoomや、それに対抗して開発されたGoogle Meet(Google)、Messenger Rooms(Facebook)は現代の通信技術を以て電話を拡張したものですが、Clubhouseチャットを拡張したプロダクトです。結果的に両者は近いところにあるのですが、しかし明確に異なる存在です。この設計思想の違いがClubhouseのディティールのデザインに、あくまでもチャット的な通信体験を担保するUI/UXとしてよく表れています。トークをする・聴く行為が何かのサブ体験になるように、Roomへの参加・離脱の行為がゆるく、リキッドな存在になるよう工夫されています。僅かなデザインが違うだけでこんなにも体験が違うのか、と驚きました。

さて、Clubhouseの基本は「リアルタイム音声チャット」ですが、これを「SNSという仕組みに放り込んだこと」が全体の目新しさになっています。では、そもそもSNSとは何でしょうか。

● そもそも、SNSとは何か
SNS(Social Networking Service)とは、コミュニケーションをとっていくと知り合いが増えていく仕組みのことです。まさに「社会的につなげていく」仕組みを「サービス」として提供しているわけですが「その起点となる行為は利用者のコミュニケーションだ」ということが重要な点です。(そして見逃しがちです。)

従って「知らない人とコミュニケーションをとりたくない」という人はSNSには不向きな人ですし、SNSがそういった人の需要に応えようとすればSNS的な魅力は損なわれます。

(実は、SNSの運用や設計の難所はここにあります。人々を社会的にどんどんつなげていくことが提供すべきサービスなのですが、同時につながった人たちの居心地のよさにも目を配らなければならないからです。)

● リアルタイム音声チャット ✕ SNS = Clubhouse
Clubhouseは、リアルタイム音声チャットをSNSという仕組みに放り込んだものです。つまり、音声チャットのやりとりというコミュニケーションをとっていくと人々がつながっていく仕組みになっており、これをサービスとして提供しています。

具体例:私が友人のAさんをフォローしているとします。Aさんがroomに参加して誰かと音声チャットをしていることは、Aさんのフォロワーに通知されます。私が通知を受け取ってAさんが話している様子を見に行くと、Aさんは私の知らないBさん、Cさんと会話をしていました。聞いているとBさんの話している内容が面白いので、そこでBさんをフォローしてみます。BさんにとってはAさんとコミュニケーションを取ることで私とつながったということになります。

Bさんは毎日あちこちのroomで話しているので、気づいたら私はAさんではなくBさんの声を聴く時間の方が多くなっていた…なんてことになるかもしれません。Bさんには会ったこともないのに、とても親しい人に感じてしまう。そういうことが起きるのがSNSの面白さだったりします。

他のプロダクトとの比較

● Discordとの違い
Discordは、その役割はSlackMicrosoft Teamsと同じコラボレーションツールです。Discordは同好の士、SlackMicrosoft Teamsは組織において使われるという枠組みの柔軟さに差異がありますが、どちらも決まった枠組みの中で円滑にコミュニケーションを行ったり情報共有を行うために設計されており、SNSではありません。

● Podcastとの違い
PodcastもSNSではありませんし、そもそもリアルタイムではないので当然全く違うものと言えます。Podcastは完成されたパッケージコンテンツを提供する場ですね。

● Voicy、stand.fm、spoonとの違い
多少SNS的な体験はありますが、これらはやはりSNSとしては作られていないので別物です。Voicystand.fmspoonはメディアとして設計されています。SNSも、コミュニケーションの結果としてコンテンツは生まれるので、それらを掲載するメディアと捉えることもできますが、SNSとメディアでは社会に対して何をサービスとして提供するのかという設計思想が違うので、その点で別けて捉えた方が実態が把握しやすいと思います。

※メディア論では、メディアという言葉の意味するところが様々あり、広義の意味では空気もメディアと捉えることもあります。ここでのメディアは「メディア産業」という単語で意味されるような、極めて狭義の“メディア”と理解してください。

ちなみに、あえてClubhouseをメディアとして見てみるならば「音声チャットをUGCとしたメディアである」と言えます(UGC:ユーザーが生成したコンテンツ)。このアプローチは、テキストチャットにおいて755がチャレンジしたことと比較して語ることができるかもしれません。

音楽ライブにおけるClubhouseの可能性

さて、ここからより自分の専門領域に近づけて話していきます。

私が参加したあるグループで、外国人のユーザーたちが簡単な演奏してJazzyなセッションをしているものがありました。寝転がって心地よく聴いていると、あるタイミングで観衆が「Wow!」と声を出したり「ヒュー!」っと口笛を吹いたりしていました。このオーディエンスの声が入ってきたとき「これはとてもリアリティのある体験だぞ!!!」と思わず立ち上がったのです。

この一年、COVID-19の感染拡大防止のために、たくさんの音楽ライブが中止・延期されました。そうした中、オンライン配信を試みる動きも見られました。昨年6月、サザン・オールスターズの横浜アリーナ無観客公演の総視聴者数50万人に上ったことが話題になりましたし、お金を払って何かしらのオンラインライブを観たという方も少なくないと思います。無料のYouTube Liveを観た、思わずスパチャ課金してしまった!という方もいるでしょう。

これらの施策は物珍しさやコロナ禍での工夫ということもあり概ね好評でしたが、一方で実際のライブに比べると身体的な体験に弱さが残ることも事実です。そこには「インタラクション(双方向性)がない」という指摘がよくされてきました。そこで昨年の後半にもなると「配信ツールのオープンチャットやTwitterの投稿を司会者がピックアップし、パフォーマーがそれに対してコメントする」といったやり方が取られたりしていましたが、これはまさに“システムの欠陥を運用でカバーする”光景であり、何とかする方法はないのかな…と思っていたのですが、その答えをClubhouseの中に見ました。

答えは単純で、オーディエンスの声を開放するということです。Clubhouseの音楽ライブで体験したことは、一緒に聴いているオーディエンスが自由に声を上げることで熱狂が伝播するという、ライブ体験のそれそのものでした。ライブにおけるインタラクションというのは、パフォーマーとオーディエンスのインタラクションだけでなく、オーディエンス同士のインタラクションも重要だったのです。

これは、SHOWROOMがかなり工夫していたことだと思います。あるいは、昨年のハロウィンでKDDIが中心となって行った「バーチャル渋谷」にもそこに着目したデザインはありました。しかしこれらは不十分だったのです。いい音楽を聴いて反応するときには、テキストを入力したり、アイテムを投げたり飛び跳ねたりするボタンをタップするのではなく、やはり身体的に声を上げて反応したい! その反応をオーディエンス同士で共有し、パフォーマーも更にそれに反応する。これこそが音楽ライブにおけるインタラクションだったのです。

ただ、もし仮に私が「オンラインライブでオーディエンスに音声参加させよう」という提案を受けたら「やめたほうがいいと思う」と返事をしたと思います。そんなことをしたらカオスになると思ってしまっていたからです。

しかし実際にClubhouseでそういったライブを聴いていると、カオスにはならず、心地よい空間が実現されていました。演奏の一幕でひとしきり拍手や歓声が上がったあと、また落ち着いた演奏になればみんな耳を澄ますかのように黙っていたのです。当たり前ですが、実際のライブだってそうやって聴いているので、オンラインであっても同様の条件の下に行ってよかったのです。これはオンライン音楽ライブにおける大きな示唆です。

もちろん、レイテンシーの問題など、パフォーマンスを提供する上での技術的な懸念点はあります。それは5Gの普及など通信技術が向上することで解決されていくでしょうが、そもそもこの場はその水準ほどの高い完成度のコンテンツが期待されているわけではないとも思えます。

技術的な可能性といえば「パフォーマーとオーディエンスを識別して音量調整を行う」という機能は検討できます。発話権限のあるユーザーを更に権限で区分し、オーディエンスから入力されてくる音については一定音量以下に抑えるようコンプレッサーをかけるということです。それによって「背景音声としての観客の声」とそれに乗っかるパフォーマーの音声という音に合成してオーディエンスに届けることができます。こういった処理を施せるのがデジタルの持つ優位性です。

統合化する音声コンテンツ市場と、激化する耳の可処分時間の奪い合い

リモートワークの普及よって、家で音楽を聴く時間が増えたといわれています。そのプラットフォームとして最大のSpotifyはユーザー数が約3.2億人に上り、その増加率は前年同月期約30%増とのことです。

ストリーミング・サービスの普及はこの5年ほどの出来事ですが、音声コンテンツ市場は急速に統合化されています。“音楽”コンテンツ市場ではなく、“音声”コンテンツ市場です。Spotifyなどストリーミング・サービスのインターフェースの中では、Podcastと音楽が同列に表示されています。ユーザーはSpotifyを開いたとき、Podcastのコンテンツと音楽のコンテンツのどちらかを選択するという体験をします。つまり、そこでは『kemioの耳そうじクラブ』とOfficial髭男dism『Pretender』が戦っているわけです。さらにいうと邦楽と洋楽も同一市場です。(コンテンツがデジタル化してインターネットに接続されると市場はグローバル化します。)サザン・オールスターズはミシェル・オバマと戦っていますし、霜降り明星はドン・ディアブロと戦っています。みなさんの耳の可処分時間を奪い合う戦いです。

この戦いにClubhouseも加わっていますが、実は上記とは違う場所にいるユーザーの耳を射止めるはずです。それはClubhouseがSNSであるという点が効いてきます。

音楽やPodcastを聴こうとするとき、その行動動機は内向的な心理状態に起因すると考えられます。「集中しよう」とか「気持ちを和らげよう・高めよう」というかんじです。SNSはその逆で、その行動動機は外向的です。「みんな何しているんだろう?」「ぼくは今こんなことをしているよ!」といったかんじです。Instagramのストーリーを開くときの気持ちを想像してみると分かりやすいでしょう。

画像4

このマトリクスで捉えてみると、実は「耳の可処分時間を奪う」「外向的な行動動機に応える」を満たすサービスのポジションは空いていることが分かります。「リアルタイム音声チャットをSNSという仕組みに放り込んだ」ことが体験だけでなく、ポジショニング戦略としても素晴らしいアイデアであったということです。

Clubhouseでは何を話すべきか

最後に「Clubhouseでどのような話をしたらいいだろう?」と考える方に向けて、企画に役立ちそうな話を書いておきます。

少し前にDos MonosTaiTanがPodcastで「PodcastはVRである」という論を紹介していました。私見も交えて要約すると次のような論です。

テレビとラジオの違いは何か。テレビには画面の“あちら側”と“こちら側”がある。明確にある。あちら側はフィクションで、こちら側がリアル。ラジオにはそんな境界線はない。“あちら”も“こちら”もない。ラジオで人が話しているのと実際に隣で人が話しているのは同様と認識され得る。テレビの画面で人が話している姿を見て、実際にそこに人がいるとは思わないだろう。しかしラジオを聴いていると、あたかもそこに人がいて話しかけてくれるかのように錯覚するようなことがある。テレビは画面の中(=虚構)と外(=現実)があるが、ラジオにはそれがなく、あたかも現実が拡張されていく(Virtual Reality)かのようである。ラジオはPodcastと言い換えてもいい。音声コンテンツの持つ温かみや親しさの正体はここにあるのではないか。

音声のみ(ラジオ・Podcast)と映像と音声(テレビ)であれば、後者の方が情報量が多い→リアリティが高いと考えがちですが、実は「画面の上の映像」すなわち“これは虚構である”という情報が加わり、リアリティが下がってしまうという逆説的な発見でした。

もう一つ、彼の主張として「Podcastは思考の実況中継である」という論がありました。私見も交えつつ要約します。

テキストコンテンツは、考えた結果を伝えるもの。対してPodcastは考えている途中の過程を伝えるところにコンテンツとしての魅力がある。音声コンテンツでは、お題に対して話者が答えようとして「これはAですね。なぜなら〜〜〜〜あれ、そう考えるとこれはむしろBと考えた方がいいですね」といったことがよくある。ここで面白いのは、視聴者に話者の思考の過程が伝わることである。

テキストコンテンツは「考えたこと」を伝える形式、音声コンテンツは「考え方」を伝える形式としてそれぞれ適しているという話です。それぞれの形式でコンテンツを編集する上では、この点に気を配ることが重要です。

逆にするとヤバい。テキストコンテンツで「Aである。なぜなら〜〜〜〜あれ、いや、これはむしろBである」と記述されていたら「必要なことだけ書けよ!」と思ってしまいますし、音声コンテンツで「Aである。すなわち〜〜〜である」と明快に語られても「台本を読んでいるのかな」と物足りなさを感じてしまいます。

つまり、音声コンテンツでは考えたことや知っていることを話すよりも、話者の考え方を伝えるようなコンテンツを考えた方がよいだろうということです。Roomのテーマはそういった編集・企画の観点で設定してみましょう。知りすぎていること、分かりきっていることよりも、少し考えてしまうテーマや切り口を選んでみてください。

考えた結果を話すのではなく、考えていることを考えながら話すことがコンテンツになります。考え始めたらすぐにそのまま、思考を垂れ流すように話し出すとよいでしょう。もちろんコンプライアンスや他人を傷つけるような発言はしないように気をつけなければなりませんが、それは不特定多数の前で話すのであればまずマナーとして身につけておくべきことです。

思考のゆらぎが伝わることが音声コンテンツの魅力。そう考えると、様々なインタラクションによって話者同士の考えにゆらぎが生まれる余地のあるClubhouseは「魅力的なコンテンツが生まれてくる土壌」であり、とても期待が持てるプラットフォームです。

おまけ

画像3

Clubhouse @ezeroms の名前で、夜の時間帯に「スタートアップ生中継🔥 「Chooning」開発ライブトーク!」という配信をしています。開発しながら考えたこと、音楽、ストリーミング、テクノロジーなどのキーワードでお話します。誰も来ない時間帯はGithub Issuesを整理しながらぶつぶつ独り言を言っています。よかったら覗いていってください🙃

文:イワモトユウ(Chooning 代表)


この記事が気に入ったらサポートをしてみませんか?