見出し画像

#1 VOCALOID β-STUDIO:VX-βの基本情報

DAWを使いこなし、既存の歌声合成も使ったことがあるというガチ勢で、抽選に応募しようかどうしようか迷っている人向けの基本情報をまとめてみました。

「VOCALOID β-STUDIO」はプロジェクトの名前で、「VX-β」はプラグイン形式のソフトウェア本体の名前ということのようです。VX-βの「V」はVOCALOIDの略、「X」は「未知の」というニュアンスを持つ語で未完のバージョンという意、「β」は試用版という意なのだと思われます。


1. VX-βの概要

参加希望者が見たほうがよさそうな、公式ページの情報をまとめておきます。

1) 動作環境

VOCALOID β-STUDIO公式サイトの「VOCALOID β-STUDIO 参加申し込み」ボタンを押すと表示されるページに書かれています。

VX-βの仕様と詳細な動作環境は、上記ページのリンクから飛べる下記のページに書かれています。

公式では、最新のマシンで、最新のOSで、最新のDAWバージョンで、というふうになってますが、自分の環境はここに書かれているような最新な環境ではないです。
後述の「処理の重さ」の項で、自分の環境でどういうふうに動作しているかを説明しますので、スペックが足りないかもと懸念されている方は参考にしてみてください。

2) マニュアル

上記、参加申し込みページの下部にある「クイックマニュアル」ボタンを押すと、PDFマニュアルが表示されます(ダウンロードもできるようです)。

3) FAQ

下記ページ内の「FAQ」の右側にある「こちらから」ボタンを押すと、よくある質問への回答集がPDFで表示されます。
VX-βでの制作に興味を持たれた方は、ざっとでもいいので、目を通しておくとよいと思います。

2. ボイスバンク

ボイスバンク(Voicebank)とは、VX-βにおける歌声ライブラリ(シンガー:歌手)のことを指します。
VOCALOIDでいうところの、「初音ミク」とか「結月ゆかり」とかに相当するものです。

VOCALOIDをはじめとする既存の歌声合成では、「歌唱データのエディタ」+「歌声合成エンジン」が「エディタ」として一体化され、「エディタ」に「歌声ライブラリ」をインストールして使う形が一般的でした。
しかし、VX-βでは、「歌唱データのエディタ」が存在せず、「歌声合成エンジン」+「歌声ライブラリ」がソフトウェア音源として一体化されています。
VX-βのインストールと同時にボイスバンクも自動でインストールされます。

1) 各ボイスバンクのデモ音源

下記ページで視聴できます。

各ボイスバンクの画像をクリックすると、声のみのサンプルがあります。

「うまくゆくことばかりではないけど ただ信じた道を歩いていこう」という歌詞の同じメロディの重唱(3声)とソロが聴けます(Multiβ-Nを除く)。
この歌声は開発者たちの心の声なのか、謎の説得力があって、心に響く。

声のみサンプルは、薄くリバーブがかかってるもののVX-βの素音にかなり近いです。
Multiβ-Nの声のみサンプルは、EQ・コンプ・リバーブのかかったお化粧した声です(制作者談)。

2) 各ボイスバンクの詳細

現在公開されているボイスバンクは以下になります(今後、増えていくらしい)。

VX-βプラグインでのボイスバンク選択画面(※)のスクリーンショットもつけておきます(各ボイスバンクの説明が書いてある)。

(※)下図の ①Voicebank をクリックすると表示される画面。

ボイスバンクを選択すると、上図の ②Singer / Style のプルダウンメニューで、各ボイスバンクごとに用意されている歌い方のバリエーションを選択できます。
各バリエーションには、その特徴を示す名前がついており、クイックマニュアルによれば、ピッチの取り方などが変わるだけでなく声質も変化するとのこと。

prtv_0 男声 Singer / Style ×4: normal 1 normal 2 light serious

(※)情報によると、「prtv」というのは「PRoTotype(試作品) Vocal」の略らしいので「プロト・ブイ」と読むといいのかも。

prtv_1 女声 Singer / Style ×4: normal cute soothing gentle

prtv_2 男声 Singer / Style ×3: normal  gentle smile

prtv_3 女声 Singer / Style ×3: normal 1 normal 2 soothing

我然β 男声 Singer / Style × 2: normal 1 normal 2
(※)「がぜん」と読むぽい。

nagiβ 男声 Singer / Style ×3: natural soft solid

multiβ-N 女声×12 f00〜f11 男声×5 m00〜m04
multiβ-Nのみは、Singer / Styleで、シンガーを切り替えます。1シンガーにつき1歌唱スタイルで、計17声があります。
(※)「f」は「female(女性)」、「m」は「male(男性)」の略ぽい。

ゲキヤクβ  女声 Singer / Style × 2: -常備薬- -検体-
(※)同名のUTAU音源が元になっている

カゼヒキβ 中性的な声 Singer / Style × 2: -常備薬- -検体-
(※)同名のUTAU音源が元になっている

3. VX-βの声域と声質

VX-βの声域と声質について、実際に使ってみた感想ぽいものを述べます。
「それってあなたの感想ですよね?」「おっしゃる通りその通り」

1) VX-βの声域

声のみのデモ音源で使用されている声域は、ある意味、各ボイスバンクにおける適性な声域を示唆しているように思えます(multiβ-Nのデモは少なくともそうです)。
VX-βは、一般的な人間歌唱の声域を超えていても、それなりに歌ってくれますが、適性な声域を越えると表現力が落ちる傾向があります。
具体的には、声量が落ちてきたり、声質がやせてきたり(倍音成分の欠落)、つんざく声になったり、歌詞の発音が不明瞭になってきたりします。

人間歌唱の場合、歌手ごとに声域の限界がはっきりとあって、声域の範囲を超えるとまったく歌えなくなってしまいますが、VX-βでは、それなりに歌えてしまいます。
その点がちょっとクセモノで、歌えてはいるものの表現力は落ちているので、本来のポテンシャルを発揮できていないわけです。

しかし、こうした表現力の落ちた表現もまた、歌唱表現としては重要な意味を持ちます。
管弦楽法では、各楽器が演奏できる音域のうち、最高音・最低音付近の音域のことを「極限音域」と呼び、取り扱いに注意するよう促しますが、「使ってはいけない」と書かれることはないです。
その楽器でかろうじて演奏できる苦しそうな音そのものが音楽的に重要な意味を持つからです。
とはいえ、そうした極限音域の表現は、極限音域ではない豊かな表現を行える音域との対比があって、はじめて意味を成します。

VX-βはある種、広大な極限音域を持っているとも言えるので、適性な声域をよく吟味しないと、常に極限音域で歌わせているということにもなりかねません。
各ボイスバンクの適性な声域はどこらへんにあるのか、いろいろな声域を試して、探ってみることをお勧めします。
(※)VX-βプラグインの「Key」で簡単に試せます。

ボイスバンクごとの適性な声域は公表されていませんが、一般的な女声ボーカルの声域は (F2-)A2〜E4のあたり一般的な男声ボーカルの声域は A1〜-E3(-G3)あたり です。
なので、そこらへんを目安に探るとよさそうです。
VX-βが最大限の表現力を持つ声域の範囲は、人間歌唱と同程度に、わりと狭い(1オクターブ半程度)ということを念頭におくとよいと思います。

一般的な声域

2) VX-βの声質

VX-βの出力は、VOCALOIDと同じくモノラル、モノフォニック(1声のみ)です。(VX-βをステレオ出力のソフトウェア音源として挿入することもできますが、ステレオの声が出力されるわけではありません。)

VX-βの声は、残響なしのクリーンな声で、中高域がきれいに伸びており、ごちゃごちゃした伴奏があっても埋もれにくいです。
ただし、低域は200-400Hzあたりから減衰し、100Hz以下はほとんどありません。

女声(Multiβ-N:f03)がA♭3を歌っているときの周波数スペクトラム(「と」を発音)
男声(我然β)がA♭1を歌っているときの周波数スペクトラム(「あ」を発音)

声における100Hz以下の帯域は、リップノイズや「吹かれ」といった意図しないノイズ成分を多く含みやすい上、伴奏のベースやドラムの帯域ともぶつかることになります。
そのため、ポップスやロックの歌唱に対してはたいていの場合、EQなどで低域をばっさりとカットします。
なので、VX-βの声は、ポップスやロックに最適化された声質とも言えるかもしれませんし、エフェクトの下処理なしにすぐに伴奏に馴染む即戦力の声質とも言えるかもしれません。

反面、低域がそもそも存在しないため、アカペラ・コーラスによくある(マイクの近接効果で得られた)重低音ベースな声や、クラシック系のバス歌手による重低音の表現には向いていません。

3. 処理の重さ

VX-βプラグインのインストーラーのファイル・サイズは、ボイスバンクのデータ込みで200MBを切り、かなり小さいです。
メモリの使用量も少なく、プラグインの表示/非表示の切替・ボイスバンクの切替・シーケンスの読込みなども軽快に動きます。
ただし、CPU処理はやや重めです。

VX-βプラグインは同時に複数のトラックに挿入することができますが、たくさんのトラックに挿入する場合は、CPU処理の重さに注意する必要があります。
自分の環境(10年近く前のiMac)では、以下のような感じでしたが、最新のマシンなら問題なく動くのかも。

1) 自分の動作環境

iMac(Retina 5K,27-inch,Late2015)
プロセッサ: 4Hzクアッドコア Intel Core i7
メモリ: 32GB
起動ディスク: 250GB SSD
OS: macOS Monterey 12.6.8
DAW: Logic Pro + VOCALOID5 Editor

2) VX-β×6トラック

VX-βのみで動作すれば動くが、オーケストラの伴奏(サンプリング音源トラック多数)と同時には再生できない。

→ 伴奏トラックをバウンス(レンダリング:wav書き出し)して、VX-βトラックの調整。

例)VOCALOID β-STUDIO VX-β 交響的狂詩曲いろはうた/ Symphonic Rhapsody Irohauta

3) VX-β×8トラック

VX-βのみでも動作しない。CPU処理メーターが振り切れる(場合によってはDAWごと落ちる)。

→  VX-β×4トラック、伴奏トラックをバウンスして、残りの VX-β×4トラックの調整。

例)Multiβ-Nのデモ


この記事が気に入ったらサポートをしてみませんか?