歌声DB制作用の資料
歌声DBを制作するための、参考資料の配布所です。
Dropbox上に、ZIPファイルとして置かれています。
個人の趣味用途を想定して、作成した資料です。同梱されているテキストに記載されている「使用上のお願い」を、ご確認お願いします。
資料のダウンロードリンク
歌声DB製作チュートリアル
図表ありの概要資料
2022/05/08更新、バージョン0.72
歌声DB製作資料
図表なしの詳細資料
2021/07/29更新、バージョン0.71
歌声DBとは?
NNSVSやENUNUのようなAI歌声合成ソフトでは、個人でも日本語のAI歌声モデルを制作することが可能です。AI歌声モデルは、AI歌声ライブラリやAIシンガーと呼ばれることもあります。
そのAI歌声モデルを生成するための学習素材となるものが、歌声DBです。歌声DBは、歌声データベースと呼ばれることもあります。これには、(1)歌声データ(2)ラベルデータ(3)楽譜データの3種類のデータを含みます。
歌声DB制作とは?
NNSVSやENUNUの歌声モデルを作成する際の前半の工程が、歌声DB制作工程です。これには、歌唱・ピッチ補正・ノイズ除去・MIDI調整・ラベリング・MusicXML作成などの工程を含みます。
この歌声DB制作工程についての情報が、「歌声DB製作チュートリアル」と「歌声DB製作資料」に、まとめられています。ただし、日本語歌声DBの制作のみに対応しています。
歌声DB制作には、様々な方法がありますが、これらの資料ではoto2labとsetParamを使用する方法を説明しています。これは、UTAU音声ライブラリの制作スキルがある場合には、習得をしやすい制作方法です。
補足
歌声DB制作のための各種素材やツールに関する情報も、資料に含まれます。
また、「歌声DB制作用のツール・素材」の記事にて、資料の配布リンクをまとめています。
資料では、おふとんP歌声データベースと御丹宮くるみ歌声データベースの制作の際に蓄積されたノウハウを、使用しています。
資料には、後半の学習工程に関する情報を含みません。ENUNU学習工程については、ENUNU学習実行用の資料のページで資料を配布しております。
問い合わせ
資料に関する問い合わせは、ツイッターアカウントのほうへお願いします。