見出し画像

【音声3.0のUXを考える】第1回 Radiotalk立ち上げ期の振り返り

XTechグループで音声配信の事業を行っているRadiotalk代表の井上(@JD_KAORI)です。Radiotalk(ラジオトーク)は2017年に、もっとも手軽にポッドキャストを配信できるサービスとしてリリースしました。当初は幅広いメディアを想定していたのですが、「音声のエンタメ」を健全に生み出す新しい仕組みをめざした結果、2〜3回のピボットを経て、現在は熱狂コミュニティを育てるプラットフォームへと進化しています。ビジネスモデルはライブ配信での「ギフティング」。ライブ配信市場は動画が築き上げたものだと捉えていますが、Radiotalkが作っている音声のギフティングでは、従来のライブ配信とはまったく異なる配信者・体験が集まっています。まさに新興市場です!

さて、先月IVS2021にて「これからの音声テックの話をしよう」セッションに登壇しました。そこで語った音声関連市場の変遷から見た考察と、現在の問いを3回に分けて書いていきたいと思います。ここでは現在〜これからを「音声3.0のUX」として、音声デバイスが注目され始めた2017年頃までを音声1.0と置き、今回は全体俯瞰をした上で音声1.0のUXを改めて振り返ります。

これまでの流れを音声の「役割」で整理する

アプリ「Radiotalk」は、一度設定すれば自動でSpotify、Amazon Music、Apple Podcastsなど様々なサービスに無料で自動配信できます。無料です(2度目w)。当初は配信ツールをベースとしていましたが、時代に即した形に変化させています。

前提として、グローバルでの音声サービスはどのような変遷を辿っているかについては以下STRIVE根岸さんの記事にわかりやすくまとまっています。

これから3回の連載では、「聞く音声」「話す音声」の双方まとめた「音声の持つ役割」を、情報性/機能性/情緒性、の3つに分類した上で、情報性 → 情報性+機能性 → 情報性+機能性+情緒性 、と拡張している時代の過程にいる、という考察をしていきます。

まず、3つの分類の定義です。

1. 情報性
何かをしながらニュースや考察を聴く、新しい知識や知見を得ることがメインとなる役割です。音声メディアのはしりとも言える「ラジオ」はそもそも、戦時中には正確な情報を伝える手段となり、その後テレビが普及するまでは主要なニュースを届ける役割としても担ってきた歴史を持ちます(歴史はまた今度詳しく書きます)。

2. 機能性
指示の手段としての役割です。「OK, Google」「Hey, Siri」と呼びかけて家具やアプリを操作する、カーナビを指定するなど、「モノに指示する」機能のために音声入力を使う、いわゆる"VUI"や "Conversational AI"、「音声アシスタント」が果たします。受け手のVUI(ボイスインターフェイス)としては、通知音や音声ガイドも(密度によって情報性も含みますが)脳に指示する点で今回は機能性を含むと考えたいと思います。

3. 情緒性
音楽から考えるとわかりやすいかもしれませんが、流れているだけで「なんとなく居心地を変えてくれる」役割です。たとえば何か緊張している日に沈黙の喫茶店にいるとして、隣の席から熟年夫婦のたわいもない会話が流れてくる、女子高生の明るい笑い声が流れてくる、など(何がフィットするのかはその時々ですが/ここも今後書きます)声が流れているだけで少し肩の力が抜ける、楽しい気がしている、といった効能です。同じ喫茶店にいても、他の客0名で無人スタッフの無音状態にいることと、知らない人でも楽しそうな話が流れているのとでは、部屋の「居心地」がかなり異なります。

(図は上述の記事「Podcast業界の変遷」から引用)

こうしてみると、「情報性」は放送としてのラジオが切り拓いたのち、より手軽に誰でも技術さえあれば発信できる「ポッドキャスト」が国内だと2005年頃に登場。しかし、そこから10年の国内は、プロダクトの進化は目立っていませんでした。テキストでは"mixi"から"Twitter"、動画は「ニコニコ動画」"Instagram"に"TikTok"……というように、PC→ガラケー→スマホ、とデバイスのモバイル化に伴って最適な配信UIが整っていったにもかかわらず、ポッドキャストにおいては「自身でサーバ設置しファイルをアップしRSSでwwwへ公開し……」と手間が必要でした(海外ではだいたい2008〜2015年にかけて、PodbeanやAnchor, Sticherなどスマホでも簡単に音声をアップロードできるプラットフォームが多数生まれています)。

なぜRadiotalkは音声市場の中で「ポッドキャスト配信ツール」から始めたのか?

そんな中、2017年には国内でもスマートスピーカーが発売されたことをきっかけに、「機能性」に着目した音声市場の認知が広がりはじめます。メアリーミーカー氏の"Internet Trend Report"でも「最も効率的な入力インターフェイスは音声だ」とされて話題になりました。

このタイミングでRadiotalkを立ち上げることにしたのですが、2017年で注目された音声の「機能性」は、技術成長のためにはまだまだデータ量自体が足りていません。当時のGoogleが増加傾向にあるとしていた英語圏での音声クエリですらやっと約20%だったので、国内の「スマホで手軽に音声配信する」体験が一般的にない時点で、話題性に対してサービス・コンテンツが不足している状態でした。

そこで、まずは2017年時点ですでに米国で毎月4人に1人が聴くほど価値が証明されていたポッドキャストを、国内でも「誰でも・スマホで・あらゆる面に配信できる」アプリを立ち上げました。当時はSNOWやTikTokなどティーンでも簡単に編集できるレベルの操作性・クオリティが重要だったため、「簡単に、実力以上の仕上がり」をめざすことにしました。

【立ち上げ期のRadiotalk(この時点はまだ「音声1.0」とします)】
① 誰もがいつでもどこでも無制限に
② 手軽に、あらゆる面に

(Radiotalkから配信できる外部サービス:Spotify、Amazon Music、Apple Podcasts、Google Podcast、TikTok(15秒テロップ動画に自動変換)、Instagram Stories(12秒テロップ動画に自動変換) etc...)
③ 簡単に、実力以上に
(声の高さ、声質、速度、トリミングやカットなどの編集が指一本で完了)

この時点では、「情緒性」については一応「ラジオって、あったかいよね!」などラジオリスナー界隈では言ったりもしたのですが、これは体験しない限りどんなに説得しても共感されないもので、おまけに共感されないと距離を置かれることがあるのでw、あまり音声の強みとしてアピールしてきませんでした(例えると、共感覚を持つ人が「ド」の音色を聴いて「甘いよね!」と言っていることに「わからない、、、」と負い目を感じてしまう状態に近い...)。

Radiotalkでは、まずはまだ空きがあった「情報性」に注目し、情報としての密度が上がるよう、インタラクティブなコミュニケーション要素をおさえ、1人で間をあけずに語り続ける必要がある収録型(コメント機能なし)からスタートしています。つまり、この時点で集まったユーザー(イノベーター)は、0からコンテンツを作らなくてはならないため、限りなくストイックな「創作者」です。

そこから2019年〜2020年頭にかけて、stand. fm や UUUM社の提供するREC など同様の音声配信サービスが立ち上がります。音声配信サービスの市場全体で見ると、はじめしゃちょーさん(REC)、西野亮廣さん(Voicy)、篠田麻里子さん(stand. fm)、ミルクボーイさん(Radiotalk)、野村萬斎さん(Radiotalk)、ダ・ヴィンチ恐山さん(Radiotalk)、イケダハヤトさん(Voicy)、鹿島アントラーズさん(stand. fm)、などなど......と、マス認知を持つ著名人がリスナーを増やしてくれるケースも生まれ、音声配信の一般化が促進されました。

そこでRadiotalkでは、次のステップとして、「情報性 + 機能性」に着目した企業向けのマネタイズを始めます。今回はこのあたりからを「2.0」と置いて、次回考察していきす!

----------------
■今後書いていきたいメモ
・情報性+機能性+情緒性 = ?
・音声が情報を届け始めた歴史
・フィットする音声とは何か?
・ClubhouseのAndroid対応でブームは再発するのか?
・Apple, Spotify, Amazon, Facebook, Twitter..国内でどう戦うのか?
・私とラジオとDLSite(急にエッセイw)
書いてほしい、話してほしいリクエストがあれば以下からどうぞ。以下をアプリで開いて「ギフト」を贈ってくださった方は、優先します!!(平伏)

----------------
■このnoteでは主に「問い」を連載していきます。そしてただ今、この「問い」を一緒に解いてくれるRadiotalkのCOO候補となるBizDevを募集しています。ポジションの詳細は以下をどうぞ。ご興味を持っていただいた方は、「まずは話を聞いてみる」またはDM(Twitter @JD_KAORI)をお気軽にどうぞ。まずはお茶しましょう!


この記事が気に入ったらサポートをしてみませんか?