初心者向けUTAU音源制作入門

UTAU音源(UTAU音声ライブラリ)を制作するための、入門記事です。

想定読者は、UTAUの経験がない個人歌い手や個人VTuberの方で、作ったUTAU音源がUTAUユーザによって使われることを目指す人です。

UTAU音源制作の際には、様々な選択肢があります。本記事は、上記の想定読者の方向けにおすすめのやり方を選んで説明する点が、特徴です。

他の参考サイト

本記事と想定読者が近いと思われる記事へのリンクを、列挙します。
さにのん 様 「UTAU連続音音源の収録&原音設定」
アマノケイ 様「UTAU界隈外の人に音源収録する際に伝えることコピペテンプレ」
「UTAU音源制作wiki」

詳細な資料集も、用意しております。ただし、この資料には使用頻度が低い情報も多数含まれています。分からないことを調べる用途に限定して参照することを、おすすめします。
ちていこ 「UTAU音声ライブラリ制作用の資料」

UTAUとは?

UTAUは、飴屋/菖蒲 様により開発された歌声合成ツールです。波形接続方式の歌声合成ソフトであり、音声ライブラリを誰でも簡単に制作して配布することができます。音声ライブラリを使用することにより、誰でも収録者の声で歌を歌わせることができるようになります。

UTAU音源には、原音のwavファイルがそのまま含まれます。この点が気になる場合には、別の音声合成ソフトの使用を検討するほうがよいでしょう。

目標

UTAU音源を制作・リリースして、収録者以外のユーザを1人以上獲得することを目指します。UTAU音源制作をする難易度は低いため、UTAUユーザ数に対してUTAU音源の数はかなり多いです。そのため、収録者以外のユーザを獲得する難易度は、かなり高いです。本記事では、UTAU初心者にとってはやや作業量が多い仕様ですが、使いやすさと性能を高めるために、「連続音 3音階 7モーラ」での制作をおすすめします。

機材

UTAU音源の収録に使用する機材は、歌の宅録に使用するものと同じです。下記は、例です。マイクは、予算や保管の手間を考慮して、適当な種類のものを1つ選択します。

・オーディオインターフェース : Roland 「Rubix22」
・ダイナミックマイク : Shure 「SM58」
・エレクトレットコンデンサマイク : オーディオテクニカ「AT2020」
・コンデンサマイク : オーディオテクニカ 「AT4040」

ヘッドホンまたはイヤホンは、ガイドBGMを聴くために収録中に使用しますので、密閉型のものが望ましいです。マイクスタンドとポップガードは、ノイズ対策のために使用します。

ソフトウェア

UTAU音源の収録や制作に使用するソフトウェアは、歌の宅録に使用するものとは大きく異なります。録音リストを正確に読んで、効率よく収録するために、専用のソフトウェアを使用します。
・歌声合成・調声 : 飴屋/菖蒲 様「UTAU」
・収録 : 耳ロボP 様「OREMO」
・原音設定 : 耳ロボP 様「setParam」

素材

UTAU音源の収録には、録音リストとガイドBGMを使用します。これにより、制作の手間を削減することができます。本記事では、「連続音 7モーラ」の素材を使用します。

録音リストは、よく使われるものを使用するほうが原音設定を依頼しやすいです。ガイドBGMは、収録の際に発声開始のタイミングと発声すべき音高がわかりやすいものを選ぶとよいでしょう。
・録音リスト: 巽 様「巽式連続音録音リスト 7モーラ」
・ガイドBGM : まいこ 様「まいこ製連続音ガイドBGM 8モーラ 」

「モーラ」とは、おおまかには録音リスト1行あたりの文字数に近い意味です。本記事の推奨素材では、ガイドBGMのモーラ数が録音リストのモーラ数より1つ多いですが、末尾音素の音が途中で切れてしまわないようにするために、この選択をしています。

工程概要

UTAU音源を制作してからリリースするまでの工程概要を、まとめます。いくつかの工程は省略しています。記事末尾の「二つめ以降のUTAU音源制作の際のガイド」の節にて、省略した工程に言及します。

1 音源構成の検討
2 収録
3 原音設定
4 キャラクターイラスト
5 その他音源同梱物
6 利用規約
7 アップローダー
8 音源配布動画

1 音源構成の検討

本記事では「連続音 3音階 7モーラ」でのUTAU音源制作を行いますが、その「3音階」の構成を検討します。

UTAUエンジンは、低い原音を高音にピッチシフトさせて歌わせることは得意ですが、高い原音を低音にピッチシフトさせて歌わせることは得意ではありません。そのため。下記のような方針をおすすめします。

・下の音階:安定して発声できる範囲内で、できるだけ低い音階での収録をするとよいでしょう。
・真ん中の音階:UTAUで歌わせる際に、最もよく使われる音階です。UTAU音源のキャラを表現する上で妥当かつ魅力的であり、発声しやすい音階を選ぶとよいでしょう。
・上の音階:あまり高い音階にする必要はありません。ただし、UTAU上でサビなどを歌わせる際に、真ん中の音階の声とは雰囲気が変わる方が、表現力が増します。そのため、裏声やミックスボイス等に切り替わった声を収録できると、よりよいです。

上記のようなことを考慮し、収録者の得意音域にあわせて収録音階を検討します。無難な音階構成だと思われるのは、下記例のようなものです。
・女声 : G3、D4、A4
・男声 : C3、A3、E4

歌い手やVTuberの人の場合、いくつかの歌唱スタイルを習得済というケースもあると思います。どの歌唱スタイルを使用するか、どういう曲を歌うときの声をイメージして収録するかを、収録前に決めておくとよいでしょう。

2 収録

UTAU音源の収録には、OREMOという専用のソフトウェアを使用します。OREMOに録音リストとガイドBGMを読み込ませて、収録を行います。

UTAUの録音リストには、日本語の音素を効率的に収録するための呪文と呼ばれる文字列が含まれています。これを、ある程度一定の音高で発声して収録することにより、UTAU音源の原音とします。

この工程は、下記の記事の「2/3」を参照して進めるとよいでしょう。
さにのん 様「UTAU連続音音源の収録&原音設定」

UTAU音源を収録する際の注意点を、簡単に列挙します。
・音量が小さくなりすぎないように、かつ、音割れしないようにします。
・先に、ある程度声出しをしてから収録するほうがよいです。
・慣れていない場合は、3音階を2~3日に分けて収録をするとよいです。
・連続音音源では、録音リストの1行に含まれる音素を、なめらかにつなげて発声します。ここは見落としやすいポイントですので、注意します。
・声質や発音の雰囲気は、1つの収録音階の中では統一します。別の収録音階にうつった後も、声質と発音の変化は、他の音階の声と自然につながる範囲内にとどめるとよいでしょう。
・ピッチが少々揺れていても、UTAUにて歌声合成をしたときにピッチが不安定になることはありません。ピッチはあまり気にせず、魅力的かつ安定した歌声で収録することを目指すとよいでしょう。
・読み間違いや発音ミスをした場合には、すぐにリテイクをするほうがよいです。後からのリテイクでは、声が変わってしまうことがあるためです。
・慣れないうちは、収録後すぐに原音を再生して、問題がないかを確認するほうがよいです。特に、収録漏れの音素がないかどうかに注意します。

3 原音設定

原音設定は、UTAUの原音ファイル(wav)のどのタイミングにどういう音素があるかを定義する工程です。setParamという専用のソフトウェアを使用して、行います。成果物は、「oto.ini」というテキストファイルです。

この工程については、下記の記事の「2/3」と「3/3」を参照して進めるとよいでしょう。
さにのん 様「UTAU連続音音源の収録&原音設定」

原音設定は、ある程度習熟した後でも、連続音1音階あたり1~2時間程度の作業時間が必要です。原音設定は、原音設定師に有償で依頼することも可能です。SKIMAやココナラ等で、依頼先を探してみるとよいでしょう。

4 キャラクターイラスト

UTAU音源に付属するキャラクターのデザインをして、立ち絵を作成します。立ち絵は、UTAUユーザがUTAUカバー等の動画投稿をする際に使用するものです。全身の、何らかのポーズをとったものにするとよいです。トーク動画用途ではないため、表情差分は不要です。

UTAUのソフトウェア上で表示するキャラクターのアイコン画像も、作成します。「100ピクセル×100ピクセル」のサイズで、BMPまたはJPEG形式にて作成します。キャラクターの顔周辺のみを、アイコンにするとよいです。

5 その他音源同梱物

UTAU音源は、原音ファイル(wav)と原音設定ファイル(oto.ini)が主な構成要素ですが、他にも必要なファイルがあります。

character.txt

UTAUのソフトウェア上で、UTAU音源の概要情報を表示するためのテキストファイルです。

readme.txt

フリーフォーマットの、UTAU音源に関する説明をするためのテキストファイルです。UTAU音源名・音源形式・利用規約の参照方法・UTAU音源管理者の連絡先(例:ツイッター)などを記述しておくとよいでしょう。

prefix.map

UTAU多音階音源の各音素をどの音高のノートに割り当てるかを設定する、重要なファイルです。UTAU上で、「メニュー → ツール → prefix.mapを編集」から編集します。例えば、収録音階がG3・D4・A4の場合は、G3に「一番下~C#4」、D4に「D4~A#4」、A4に「B4~一番上」を割り当てます。あくまで例ですが、中音のD4は主力となる音素ですので、A#4まで担当させます。高音のA4は、B4以上の高音域でのみ使用します。

6 利用規約

UTAU音源の利用規約は、UTAU音源を素材として配布して使ってもらう上では必須のものです。内容としては、権利者名・クレジットの書き方・免責条項・公序良俗違反となるような利用の禁止・他人の権利を侵害する利用等の禁止・再配布禁止・機械学習のための利用の可否・商用利用の可否などは、規定しておくほうがよいです。キャラクターイメージを守りたい場合やトラブルを避けたい場合には、必要に応じて、表現規制等の規定を作成します。

7 アップローダー

UTAU音源を、アップローダーにアップロードして、配布します。UTAU音源の配布によく使われているサイトとして、BowlRollがあります。
「BowlRoll」

8 音源配布動画

ニコニコ動画上にUTAU音源配布動画を投稿します。こうすることにより、UTAUコミュニティ内でUTAU音源が使用されることを想定したUTAU音源の正式な配布であると認識されやすくなります。動画には、「UTAU音源配布所リンク」のタグをつけて、タグロックします。

本記事では、UTAUカバー動画を制作するケースを想定します。UTAUカバーの選曲に関しての基本的な考慮事項(例:楽曲の権利関係、オケの権利関係、音域など)は、歌ってみた動画の作成の場合と同じです。ただし、UTAUカバーの際には、楽譜データが必要となります。採譜を自前で行うのでもよいですが、ニコニコ動画やYouTube上にて配布されているustファイル(楽譜ファイル)を入手したり、ヤマハミュージックデータショップ等でMIDIファイルを購入するという手段もあります。

UTAUの基本的な使い方については、様々な入門サイトがあります。
kenchan 様「UTAU クイックスタート」

ボーカル編集のスキルがある場合には、UTAUではなくメロダイン・VocalShifter等の外部ツールを使用して調声をするほうがよい場合もあります。また、SKIMAやココナラ等で、UTAU調声を依頼することも可能です。

動画説明文には、UTAU音源名と権利者名と音源形式(連続音・音階数)を記述します。原音設定・調声・キャラクターデザイン・立ち絵などの工程を依頼した場合には、その旨を記載します。動画の内容としては、動画内でキャラクター立ち絵やキャラクター設定の紹介がなされていることが望ましいですが、必ずしもそうする必要はありません。

二つめ以降のUTAU音源制作の際のガイド

1つめのUTAU音源をリリースして、ユーザを獲得する等の一定の成功をできた場合には、2つめ以降のUTAU音源を制作することもあるかもしれません。この場合には、初回のときに省略した工程に挑戦してみるとよいでしょう。

表情音源

1つめのUTAU音源とは異なる声質・発音での収録を行い、歌唱表現の幅を増やします。単純な強・弱の他に、ロック・テクノポップ・ジャズ・民族調など特定の音楽ジャンル向けのものを作るのもよいでしょう。音階構成についての工夫として、高音の強い表現(ミックスボイス)と弱い表現(ファルセット)の音素を両方用意し、切り替え可能とすることも考えられます。

特殊音素

UTAU音源の表現力を強化するために、特殊音素を収録します。よく使われるものは、ブレス・歌い出しエッジ・語尾息・喉きり・フェードアウト語尾などです。

周波数表

frq形式の周波数表を生成してUTAU音源に同梱すると、UTAUユーザにとっての使い勝手がよくなります。また、ささやき音源やがなり音源等を制作する場合には、周波数表の破綻対策を行うほうがよい場合もあります。
masao 様「frqeditor」
ちていこ 「UTAU音声ライブラリ制作用の資料」

ノイズ除去

iZotope「RX」などを使用して原音に対してノイズ除去を行うことにより、UTAU音源の品質を高めることができる場合があります。

調声

収録者自身がUTAU調声に習熟し、制作したUTAU音源を使って魅力的な作品を投稿することにより、UTAU音源をアピールすることができます。UTAUプラグインの活用やUTAUエンジンの切り替え等のノウハウが、役立ちます。

UTAU音源配布サイト

音源配布サイトを作成し、最新の利用規約やキャラクター設定をWeb上で参照することができるようにします。これにより、UTAU音源およびキャラクターの二次創作や、CD等制作の際の起用をやりやすくなります。

UTAU音源情報サイト

UTAU音源情報サイトにUTAU音源の情報を登録することは、制作したUTAU音源をユーザに知ってもらう上で有益です。
「ニコニコ大百科」
「UTAU Visual Archive」

音源誕生日

UTAU音源のリリース後、音源配布日を記念日として、年に1回程度の頻度でカバー動画を投稿するとよいでしょう。音源制作意欲がある場合には、年に1回ほどのペースで表情音源を追加で制作してリリースすると、かなり活動的なUTAU音源ということになります。