#203 マルチリンガルで歌って欲しいやん?

 こんにちは、鏑木澪です。


 歌声を探して、三千里。
(歌声探しは沼である←)


 いやぁ、一途にひとりの子(ボカロ)と曲を作っているPさんもいるのだけど、「絶対そんなにいらんだろ!?」ってくらいたくさんの子を迎えて曲を作っているPさんもいます。

 私は、金銭的にもパソコンのスペック的にも余裕がないから、前者にちょっと毛が生えたような感じで、数人と仲良くなって曲を作れたら良いなと思っていました。


 ”ボカロP”という言葉が指す”ボカロ”は、「(広義の)ボカロ」であって、必ずしも「VOCALOID(狭義のボカロ)」ではないというのが私の認識です。

 今日では、VOCALOID以外にも多様な音声合成ソフトの選択肢がありますから、そのどれを使っていてもボカロPを名乗って良いわけですが(私はそう思っている)、

 私は今まで、VOCALOIDしか使ってこなかった。。。 

 私の場合、Logic Proを使いたかったので、パソコンは必然的にMacになったのですが、いかんせん、ボカロ文化はWindows向けなのか(?)

 もともとWindowsしか対応していなかったソフトが、ぼちぼちMacにも対応してくれるようになっているという話は聞くのだけど、結局、

 スタンドアローンでしか動かないとか
 機能が制限されているとか
 不具合が起きやすいとか

 なんだか、導入しにくいなと思うような情報がチラつきます。
(最新の情報は見ていないし、もともと機械系に疎い人間が適当に話しているだけなので、あまり内容を真に受けないでくださいね!)


 うぉおお!ッ

 どうすりゃいいんだァ。


「人間に頼めば?(もしくは自分で歌えば?)」という選択肢はない前提で、話を進めていきます。
(いつものことだけど、ただのひとりごとの垂れ流しです)


 現在、私が知っている範囲で1番人間らしく歌ってくれる音声合成ソフトは、『Synthesizer V』です。

 Synthesizer Vを知る前は、UTAUが私のなかで1番人間らしいという位置付けだったのですが、両者のエンジンを開発した人が同じだとか(?←エンジンと聞いても車のエンジンしか思い浮かばない。『Moresampler』とはなんなのだ)

 どちらも自分で使ったことはありませんが、YouTubeやニコニコ動画などで曲を聞いていると「知ってて聞いても人間に聞こえる←」みたいなものによく当たります。
(”魂実装済み”といわれるやつですな)

 余談ですが、Synthesizer Vにも小春六花という子がいますが、音声提供者は青山吉能さんで、『ぼっち・ざ・ろっく!』の後藤ひとり役でクレジットされているのを見た時に、「んんん?(どっかで見たぞ。音声提供者?←)」と思って調べたのが記憶に新しいです。

 話を戻して。

 これまで私は「合成音声に人間味(人間っぽさ)は求めるけど、人間として歌って欲しいわけでない」といった立場でした。

 個人的に目指している歌声(音)としては、「人間と機械の間」です。

 どんな曲を歌っているかに依存するところは大きく、曲によって「より人間的に」「より機械的に」表現しようとはしますが、やはり両者の良いとこ取りが理想です。

 今回、冒頭から「1番人間らしく歌ってくれる」といった話をしているのは、このところ「なんか、声の厚みが足りないんでね?(人間の声ってもう少し厚みがあるように感じるだよ)」と思うことが増えたからです。

 それに加えて、曲中で複数の言語を使用して歌う場合、現在、私が持っている環境でボーカルライブラリを切り替えて歌わせるという選択をすると、声色が大きく変わってしまう「同じ人が歌ってるように聞こえない問題」に直面しています。

・声の厚みが足りない
・同じ声で複数言語を歌えない

 前者は、私の調声とミックスが下手くそなせいもあると思います。
 後者は、単一ライブラリを用いて他言語に近い発音で歌わせる方法がありますが、既存曲のカバーを制作していたら、脳が焼き切れそうでした。(挙句に、その言語にない音ってのは、どう頑張ってもでない。子音も母音も、足りない←)

 もう、やだぁ。

 まぁ、声にそこまで厚みが求められないような曲を作ればいいし、複数言語で歌詞を書かなければいいのだけど、

 やってみたいって、思っちゃったんだもん。

 V6には、マルチリンガル機能が実装されているそうだから、アップグレードすれば、複数言語の問題は解決できるのだろうけど、厚みのほうは疑問が残ります。

 いや、”厚み”ってなんだよって話です。

 人間(歌手)でも「厚みのない声」と私が個人的に感じるものはあります。

 声が太けりゃいいかといったら、そういうことではなく、「こういう曲はこういう声で歌って欲しい」という私の希望と好みが、今回話題にしている”声の厚み”です。

「お前の基準なんぞ、知らんわ」って話ですわな。←

 私も、言語化できなくて、自分が欲しがっているものがよくわかりません。
(救いようがない←)

 深みと柔らかさかな……?


 2000字も書いてきて、結論はなく、「Synthesizer V導入しようかな? どうしよう……」ってだけの話です。←

 あの、私、利用規約とか読むの苦手で、時間がかかるから、そこもちょっとネック。(導入するならしっかり読まなきゃだからね)

 私は、作ったものを配信したいから、権利関係とか、要チェックなのですわ。

 ボカロの場合、ボーカルとして使ったか、シンセサイザーとして使ったか、キャラクターを使うか、みたいなところで許可を取るところが違うからのぉ。

 フリーのも増えてきてるのだけど、「この条件で」ってのがあるから、ちゃんと把握しておかないと。

 うん、覚悟ができたら、導入しよう。
(自分で読んで理解してからじゃないと安心して使えない)


 あと、これまで私は、V5でAI機能を使わず手動で調声してきたけど、Synthesizer VにするとAIにやってもらうところが増えそうだから、そこのところもよく考えたほうが良さそうです。

 エディターが使いにくいとなると、めっちゃストレス溜まるからなァ。

 んー、悩ましい。


 ではでは〜


この記事が気に入ったらサポートをしてみませんか?