歌声DB制作用の資料

歌声DBを制作するための、参考資料の配布所です。

Dropbox上に、ZIPファイルとして置かれています。

個人の趣味用途を想定して、作成した資料です。同梱されているテキストに記載されている「使用上のお願い」を、ご確認お願いします。

資料のダウンロードリンク

歌声DB製作チュートリアル 
図表ありの概要資料
2022/05/08更新、バージョン0.72

歌声DB製作資料
図表なしの詳細資料
2021/07/29更新、バージョン0.71 

歌声DBとは?

NNSVSENUNUのようなAI歌声合成ソフトでは、個人でも日本語のAI歌声モデルを制作することが可能です。AI歌声モデルは、AI歌声ライブラリやAIシンガーと呼ばれることもあります。

そのAI歌声モデルを生成するための学習素材となるものが、歌声DBです。歌声DBは、歌声データベースと呼ばれることもあります。これには、(1)歌声データ(2)ラベルデータ(3)楽譜データの3種類のデータを含みます。

歌声DB制作とは?

NNSVSやENUNUの歌声モデルを作成する際の前半の工程が、歌声DB制作工程です。これには、歌唱・ピッチ補正・ノイズ除去・MIDI調整・ラベリング・MusicXML作成などの工程を含みます。

この歌声DB制作工程についての情報が、「歌声DB製作チュートリアル」と「歌声DB製作資料」に、まとめられています。ただし、日本語歌声DBの制作のみに対応しています。

歌声DB制作には、様々な方法がありますが、これらの資料ではoto2labsetParamを使用する方法を説明しています。これは、UTAU音声ライブラリの制作スキルがある場合には、習得をしやすい制作方法です。

補足

歌声DB制作のための各種素材やツールに関する情報も、資料に含まれます。
また、「歌声DB制作用のツール・素材」の記事にて、資料の配布リンクをまとめています。

資料では、おふとんP歌声データベース御丹宮くるみ歌声データベースの制作の際に蓄積されたノウハウを、使用しています。

資料には、後半の学習工程に関する情報を含みません。ENUNU学習工程については、ENUNU学習実行用の資料のページで資料を配布しております。

問い合わせ

資料に関する問い合わせは、ツイッターアカウントのほうへお願いします。