「RVC」と「VC Client」で超個人的に推しの声を楽しむためのメモ

流行していたので、ちょっと個人的に楽しみたくてボイチェン実験した時のメモを書いておきます。
自分用のメモなんで、ある程度知識がある人向け。何かのヒントになれば。

はじめに

必要なもの

  • Ultimate Vocal Remover:ボーカル抽出

  • audacity:音編集、切り出し、変換

  • Googleアカウント:Colabを利用するので必要

  • VC Client : 再生用

  • hubert_base.pt:VC ClientでRVCを使用するために必要なファイル

  • VB audio:仮想オーディオデバイス

上記以外になんか入れた気がするけど、多分やってる途中で気づくので最低限必要なものだけ書いておりまする。

ざっくりした流れ

  1. 音声素材を作る

  2. RVCをColabで導入

  3. VC Clientで遊ぶ

音声素材を作る

音源からぶっこ抜きたい人

Ultimate Vocal Removerを使う。使い方はここらへんが詳しい。

自分はだだっこぱんださんの方法でやりました

Audacityで音声部分のみを自動カット

コツ

  • 発話ごとに区切る感じ。(一音ごとじゃないよ)

  • 無音はカット。

  • 音楽の場合、エフェクトかかってたりコーラスが入ると台無しになるから注意。

手順メモ

  1. 音声部分のみを切り取る予定の部分を選択

  2. 上部のメニューの解析 > 音声から自動ラベル付け 選択

  3. 設定ウインドウ「音声から自動ラベル付け」 > 「閾値のレベル(dB)」の部分を「-10」

  4. 音声の部分のみを選択したラベルが出る(自分で微調整)

  5. ファイル > 複数ファイルの書き出し

参考元

音声はずんだもんでやってた人の記事が参考になるよ

ここが一番めんどくさいんで、頑張って素材作りましょう。
音源4個から40個切り出したくらいでもそこそこ精度たかい。
会話と音源両方から100個以上切り出した方はかなりいい感じ。

RVCをColabで導入

GithubにColabのリンクがあるので、自分用に複製して使います。

使い方はこの辺参考にした

VC Clientで遊ぶ

ボイチェンじゃなくて既に持ってるアカペラデータを別の声に変換したいだけなら、VC Clientは不要。
RVCから出力したデータを扱うには VC Cliant のダウンロード版が必要(Colab版では使えない)。
設定はピッチがポイント、女→男の場合は-10くらいを目安に調整するといい感じ。何より本人の喋り方とかものまねが重要。これだけで全然変わる。
遅延めっちゃする。
イヤホンしないとエコーバックで声が反響するかも。

手順メモ

  1. VC Clientのデータをgithub のリポジトリからダウンロードし、任意の場所に解凍しておく

  2. 配布元ページから「hubert_base.pt」というファイルをダウンロードして「MMVCServerSIO」フォルダの直下に入れる

  3. 「start_http.bat」を実行する

  4. RVCデータを読み込んで各種設定して楽しむ

参考リンク

各種記事を書いて下さった方々に感謝しかないです。

hubert_base.ptの配布元

変換までの参考

設定とかでお世話になりました

なんか思いついたらまたメモ更新するかも。

この記事が気に入ったらサポートをしてみませんか?