見出し画像

来たぜ!RODE Streamer X!

ついに来ました!実は到着前からすでに記事を書いていて喜びの内容だったのですが、実際に利用してみると予想していたものとちょっと違うという結果で、今はファームウェアやソフトウェアが早くアプデされないかなという気持ち。

RODE Streamer Xとは

RODEが発売したオーディオインターフェイスとHDMI経由での動画キャプチャ機能を兼ね備えたデバイスです。これ一台でHDMI出力機器からの映像や音声、マイクなどからの音声もミックスすることができます。DSPも内蔵されており、これ一台で!配信に必要な全てが揃う!という触れ込みのめちゃめちゃ嬉しい製品です。

これまでの製品ですとRolandのUVC-02が似たような立ち位置ですが、そちらはカメラの接続が想定されているのに対してStreamer Xはゲーム配信も想定しているためHDMI入力は4K対応かつThru Outの機能も搭載し、例えばゲーム用のディスプレイで遅延なくゲームを楽しむと同時にその内容を配信することができます。

ということでターゲット層は主にゲーム配信と一般配信系でしょうか(一般とは・・・)
Streamer Xは海外ですでに発売されていましたがこのたびようやく日本でも発売となりました。2.4GHz帯を使う無線機能を積んでいるので技適通す手間が増えちゃうんですよね。(BlueToothの場合識別時に受信側といえど電波を発するため必要なんですけど、Streamer XはBTじゃないので受信だけだったら技適は必要ないですね)

なぜこれがいいの?

あとでも触れますが、自分にとっては音声をUSB経由でデジタル入出力できるところが革新的でした。もちろんHDMIにも音声を載せられますが、映像ではなく音声だけをHDMIで出力するってHDMIの仕様なのかなんなのかできない(???)んですよね。

デジタル入出力できるとなぜ嬉しいのかというと、例えばミキサーでマイクなど複数音源ソースのミキシングを行い、2mixを配信に流し込みたい場合、デジタルで入力することによりレベルを固定、さらに出力を返せば最終出力のレベルをモニターできるんです。今まではHDMIの音声エンベッダーやディエンベッダーなどを使う必要があったりして音声モニタリングは面倒以外の何者でもありませんでした。配信現場では映像のトラブルより音声のトラブルのほうが圧倒的に多いので音声にフォーカスしてモニタ可能になるのはホント嬉しいです。

特色

ではもうすこし細かいスペックを見ていきましょう。

映像入出力

映像入力は4K/30、スルー出力は4K/60 HDRまでで、VRRにも対応しているとのこと。HDCPには非対応です。

音声入出力

ビットレートとサンプリングレートは24bit/48kHz、映像が絡む機器では標準的ですね。入力側ですとマイクはマイク端子、3.5mm TRRS端子経由でヘッドセットマイク、それにワイヤレスマイクの3系統が入力可能となっています。マイクプリアンプ部は先発のRodecaster Proシリーズを汲んでかなり高性能となっており、ゲインは73dBでShureのSM7Bのようなゲインハングリーなマイクもドンとこいな感じで、しかもかなりローノイズです。下のレビュー動画ではダミー負荷+Maxゲインの状態でコンピュータ上の入力音が-66dB。びっくりするくらいローノイズ。ただしヘッドホン出力にはヒスノイズがのるみたいです。ハイインピーダンスヘッドホンだと改善されるとのこと。自分のとこだとそんなに気にならないです(Sennheiser HD25使ってます)

入力は他にHDMIとUSB2からのデジタル音声入力が可能となっています。

出力はフォーン端子のヘッドホン出力、それにヘッドセット用の3.5mmTRRS端子があります。アナログ出力はこれだけなのでStreamer Xではモニタースピーカーと直接接続することはできません。別途オーディオインターフェイスなどが必要となります。

音声側の機能だけ取り出してみるとElgatoのWAVE XLRみたいな感じ。

操作系

配信に必須なミュート機能は音声のほか、動画ストリームのミュート(カット?)も可能となっており、スマートパッドもついています。パッドは4つ付いていて、効果音のポン出し、音声にエフェクト適用、MIDI信号の送信などが可能で、バンク切り替え(16バンクまで)することで64個まで設定できます。このバンク切り替えのボタンやパッドは設定ソフトウェアで「プレゼンテーションモード」とすることでプレゼンテーションソフトでのページ送りなどに使えるようにもなります。

設定の格納は本体側で、電源を切って別のマシンに繋ぎ直しても設定は維持されます。

USB2の動作について

Streamer XにはUSBが2系統あって、USB1はメインとなる配信マシンへの接続、もう一つのUSB2は音声入出力に使えるとのこと。こちらにはPS5やPC、Mac、それにAndroidやSwitch、PS5などから音声を取り込むことができます。なぜかiOSはサポート外なんですね。Androidは大丈夫なのにiOSはダメというパターンは珍しいかも。

アナログではなくUSB接続などのデジタルで音声を取り込む利点の一つとしてグランドループ起因のノイズに悩まされなくて済むことがあげられます。通常のオーディオインターフェイスにSwitchやPS5、あとはスマホなどの音声出力をアナログ接続して配信しているとブーンというノイズが混ざったりしませんか?モバイルバッテリー使っていたら大丈夫なのにコンセントから充電しようと接続したらノイズが・・・みたいな。
グランドループは違うコンセントから電源を取っている機器同士をアナログ接続すると起きやすいです。アイソレータという機器を使うことで解消できるのですが面倒ですよね。一方デジタル接続であればそのようなアナログ的なノイズから解放されます。
従来であればゲーム配信ではYAMAHAのZG01のようなHDMIを直挿しできるオーディオインターフェイスを利用してグランドループノイズを避けることができましたが、Streamer XならHDMI入力にキャプボの機能も付いていてこれ一台で音声と映像をデジタルで入力可能になります。

そこでMacと接続して実際に試してみました。が、結果としてはあまり実用的ではありませんでした。USB2に通した音声が全て-6dBされてしまうんです。たかだか-6dBと思われるかもしれませんが-6dBってことは音量が半分ということです。
Streamer Xにはスピーカー用の出力端子がないため、USB2を利用してそちらに音声を出力し、USB2に接続したコンピュータでその音声をルーティングして別のオーディオインターフェイスなりに出力することになります。その際にも音量は半分。
別マシンで音声を作り込んでレベル調節し、それをUSB2経由で出力するとStreamer Xに来た時点で音量は半分になり、配信音量のモニタ用にその音声信号を送り返すとさらに半分、つまり1/4の音量になってしまいます。
ということで流石に実運用には厳しいという結果となりました。
Streamer Xに送って帰ってきた音声が-12dBされるということはなくて、-6dBされてしまうだけのようです。

Streamer Xのミキシング用ソフトウェアのUnify上では仮想オーディオデバイスに対してゲインを個別に設定できるのですがUSB2に関してはゲインの調整ができないようです。ひょっとしてデジタル入出力は全部この仕様?

仮想デバイスならゲインを0dBに設定できる

スマートパッド

スマートパッドを利用してエフェクトをかける際、ボタンを押している間だけエフェクトが有効になるモメンタリモード、ボタンを押すごとにエフェクトのON/OFFを切り替えられるラッチモードが選択できます。
エフェクトは同時押しすることで組み合わせることも可能です。

また、配信時を想定した、フェードイン・フェードアウトやダッキング(マイクで話している時だけBGMの音量を下げるみたいな)といったミキサーの基本的なオートメーションも設定できます。

もちろんMIDI信号を送ることもできます。これはStream Deckなんかが出てきた今ではそれほど珍しい機能ではありませんが嬉しいですよね。

Pad動作を別種類のものに変える際に執拗に表示されるポップアップはどうにかしてほしいところ

ソフトウェア

最近よくあるパターンですがStreamer Xもソフトウェアで機能の多くをアンロックします。
Streamer XにはRODE CentralとUnifyというソフトウェアがあり、RODE CentralのほうはStreamer Xの設定やファームウェアのアップデート、それにオーディオミキサーの設定が行えます。
またUnifyをインストールすると仮想オーディオデバイスもインストールされ、Streamer X本体の入出力チャンネルに加えて仮想オーディオチャンネルも利用したミキシングを行えます。RODE Central+αと思って良いかもしれません。

Streamer Xはソフトウェアがない場合でもキャプチャーデバイス+オーディオインターフェイスとして利用可能です。

Rode Central

Streamer Xの設定に利用するソフトウェアです。インストール時にデバイスドライバが一緒にインストールされることはなく、このアプリ単体で動作します。嬉しいですね。またトップ画面でプリセットを選ぶことで簡単に設定を行えます。

Rode Centralではもちろんプリセット選択の他にカスタマイズも可能で

  • オーディオの設定

  • スマートパッドの設定

  • LEDの明るさの設定

などが可能となっていて、マイク入力(マイク端子入力、ヘッドセット端子入力、ワイヤレスマイク入力)に関しては細かくコンプやEQ、ディエッサーなどを適用できます。ソフトウェアではなくDSPを利用するのでコンピューター側のCPU負担はありません。

ほか、ファームウェアのアップデートもこのRode Centralから行えます。

Unify

少し前までWindowsでしか動かなかったUnifyですが、現在Macでも利用可能となっており、仮想オーディオデバイスとのミックスと録音機能を提供します。またRode社製のオーディオデバイスを入力ソースとして同時に4つまで設定、管理できるようです。

仮想オーディオデバイスはUnifyをインストールすることで7つ作られ、物理デバイスと合わせて計10個のオーディオデバイスとなります。

このうちStreamは2inの入力用、Chatは2in2out、そのほかは2outの出力専用の仮想デバイスとなっています。
セッティングはこれらの仮想オーディオデバイスごとにサブミックスを設定して、アプリケーションのサウンド出力をこれらに向けていく感じですね。モニターに関してはモニター出力用のルーティングが可能なのでそこで設定します。

問題となるのはアプリケーション側で出力を選択できない場合はどうしようもないというところです。
例えばMacのサウンド設定でRODE Unify Systemを選ぶとしましょう。本来であればChromeの出力はRODE Unify Browserに、SpotifyやMusicアプリの出力はRODE Unify Musicを選択したいところです。なのですが・・・、ChromeもSpotifyもMusicアプリもサウンド出力を選択できないので結局デフォルトのRODE Unify Systemから出力せざるを得ません。

つまり現時点でUnifyを利用する意味はあまりないということになります。もちろんRogue Amoeba社のLoopbackやAudio Hijackといったソフトウェアを利用するとうまく活用できますが、それならわざわざUnifyでミックスせずLoopbackでミックスするほうがRODEの仮想インターフェイスに縛られず使い勝手が良いです。

それとUnifyを利用しようとするとよくデバイスとの接続に失敗します。
デバイスの接続に失敗したら再度Unifyを立ち上げ直すと繋がるようになります。

機器がグレーアウトしていたらアプリを再起動すること

起動時間

およそ25秒。Thru Out側は10秒ほどで画面が出力されるのですが、いったん出力が切れてまた見えるようになります。メイン側には25秒くらいで映像が出力されます。今までRolandのV-1HD+を利用していてそちらは30秒ほどかかっていたのでこの時間を短縮できると良いなと思っていましたが期待したほどの短縮にはつながりませんでした。

価格

日本ですと今は5万円ちょっと。アメリカなどで$399(しかも税抜)で売られていることを考えるとかなり安いです。この円安の中嬉しい価格設定ですね。

まとめ

コンセプト的にはかなり素敵な製品です。うまく動けばホント夢デバイス。

ですがUSB2に入力された音声の音量が半分になってしまうところは改善してほしいです。そのほかUNIFYの接続問題の解決や使い勝手の改善、それにLEDのスリープ機能もほしいですね。
現状、人に勧められるかというと微妙な感じなので今後のファームウェアやソフトウェアのアップデートに期待したいところです。
それとMacだと接続時にキーボードの設定を求められます。プレゼンテーションモード時にパッドをキー入力として使うためですね。ところがセットアップガイド見てもその設定に関してはスルーされちゃってるんですがどうすれば・・・。

と、ちょっと残念な感じになってしまいましたがプロオーディオ製品を多く作っているメーカーだけに油断したのは否めないところ。

それでも自分の想定していた利用法ができないだけなのでWindowsマシンを利用してPS5やSwitchなどのコンソールゲームのライブストリーミングをするのには良いデバイスなんじゃないかと思います!いやきっとそう!!

とりあえずUSB2の音量半分の現象に関してはMacでのみ起こるのかもしれず、また自分の環境下でのみ発生する現象もしくは勘違いかもしれないので週末にでももうすこし追試してみます。HDMI経由の音量もまだ試していませんし。

これで1kHz0dBのトラック作れてるはず

で、その後追試してみました。

WindowsにStreamer XのメインUSBを接続し、MacからStreamer XのSecondaryに音声を送り、帰ってきた信号を測定します。送信側はPro Toolsのオーディオトラック(ステレオ)にインサートでシグナルジェネレータを入れて1kHzの信号を送りました。受信側は別トラック(もちろんこちらもステレオ)でStreamer XのSecondaryを受けるようにしています。

送信トラックはPeakを0dBとして送っています。

帰ってきた信号は・・・やはり-6dBされています。

ん???ってなりました

で、そこまでは良かったんですけどフェーズメーターが!!!
円になってる・・・???
そこで波形を見てみたら見事に位相がズレていました。念のためにLogic Pro使って追試してみてもやはり位相がズレるようです。

まだテストの仕方悪いんじゃないかって自分を疑っていますけど・・・この製品はコンシューマー向けなのかもしれないですけど・・・いやこれはさすがに厳しいのでは・・・。

いちおう配信リグを組もうと各種部品も買い揃えて万全の状態を整えてはいたんです・・・

HDMI側のテストも行いました。Mac上でRogue AmoebaのLoopbackを使って仮想デバイスを作成、Pro Toolsから仮想デバイスに送った音声をOBSに取り込みます。この際OBSのミキサーではLoopbackの仮想デバイスのみオンにします。
それからDecklink Output機能を利用してBlackmagicのUltraStudio Monitor 3Gを利用してHDMIで送出し、Streamer XにHDMI端子に入力するといった手順を踏んでいます。

こちらの方法でUSB1に接続したWindowsでHDMIから送られた音声を取り込むと位相が乱れることもなく、-6dBされることもありませんでした。HDMIから映像、音声入力してそれをUSB1で接続されたコンピュータで使うというのは大丈夫そうです。

次にこのHDMIで入力された音声をUSB2で受けるとどうなるか、ですがやはり-6dBになり、もちろん位相も狂います。

HDMI系のテストは以上です。

次に取り込み系のテストを。

USB1経由での取り込みのテストとしてMacで出力した音声をUSB2経由で入力し、それをUSB1に接続したWindowsで取り込んでみました。

RODE CentralでUSB2のフェーダーをめいっぱい上げた状態のままだと入力音声のサイン波はボリュームオーバーでクリップしてしまいます。0dBFSのサイン波を送っていたので最初はクリップに気づかず、なぜ矩形波に変化したのかとびっくりしました。

Reaperにライセンス入れると公開向きじゃなくなるので評価版なのはご容赦を

仕方がないのでフェーダーを下げてクリップされないくらいまで落とします。

0dBFSの音声をUSB2に入力してUSB1に接続したコンピュータで取り込む場合、WindowsのRODE Centralではこのくらいが0dBFS。標準で用意されているプリセットですと▶️となっているところに音量が設定されますがそれだとクリップしてしまうので下の画像にポイントしたレベルまで下げる必要があります。

では、その設定の時点でUSB2に出力される音声はどうなっているのかとMacでUSB2の出力レベルを計測すると-30dBです。

意味がわからないですね。

気を取り直してUSB1に接続されたコンピュータからStreamer Xに出力するテストです。

USB1に接続したWindows上でトーンジェネレータを使って1kHz0dBFSの音声をStreamer Xに送り込み、USB2で接続したMacで受けてみました

位相は改善されているもののやっぱりズレますね。あと若干レベルが不安定なんですが、これはWindowsのシステム側の問題なのか、もしくはUSB1経由で送られた場合の問題なのでしょうか。

ということで現時点の検証結果でした。ちなみにファクトリーリセットしても結果はかわらず・・・。

NABでの発表以来待ち焦がれていたデバイスだけにほんとガッカリしてます。

最後に、ちょっと放置した後のフェーズメーターを見てみましょう。

最初はズレ幅少なくて縦にひょろ長い感じだったのですがご飯を食べて戻ってきたら横に広がっています。どうやらフェーズは常に一定量ズレているわけではなく、時間が経つにつれてズレ幅が変わっていくようで、補正すらできないようです。

とりあえずサポートに連絡したので回答待ち・・・で、返信第一報が返ってきました。しばらくそれに対する返答を作ったりとキャッチボールが続くと思います。

その後、現象が向こう側でも確認され開発チームに連絡済みとのこと。早く修正されると良いですね。修正されたらまたレビューします。

さらにその後、ファームウェアアップデートしたら再現しなくなったんだけどどう?って連絡が来たのですが全く変わりなし。詳細なテスト手順を送ったら再現したとのことで(いや全然難しくないんだけど)まだまだ修正には時間かかりそうです。デジタル音声でフェーズがズレるってことはおそらくミキシングのタイミングでスレッドの処理が偏ってて根本から直す羽目になるのでは?