見出し画像

音声合成ソフトに大苦戦

想像以上の難しさ

DTMを趣味にしていても、そもそも曲をあまり作ってない僕ですが、そんな中でも作る曲は殆どインスト物ばかりで、歌モノは作ってなかったのですが、音声合成ソフトはそれなりに興味があって、ちょろっと試したりはしてたんですよ。

で、今回自作曲に使ってみようと思って本格的に触ってみたのですが、正直なめてました。
これほどまでに難しいとは思いませんでした。

一番扱い易そうなVoiSonaにしてみる

とりあえず、フリーで使える音声合成ソフト(有償ソフトのフリー版含む)のNEUTRINO 、Synthesizer V、VoiSona を触ってみて、VoiSonaを使う事にしました。NEUTRINOはフリーで使えるライブラリーが多くて魅力的だったのですが、決め手はVoiSonaがフリーでもVSTプラグインとして動作すると言う事です。
これは非常に大きなポイントです。触ったことがある方なら解ると思いますが、スタンドアロンの音声合成ソフトの場合、打ち込みが終わって生成した音声ファイルをオケと混ぜてみると、アカペラ状態で聞いた時とはイメージが異なる事が多々あるのです。
その度に音声合成ソフトに戻って修正しては音声ファイル書き出し→DAWにインポートして確認という作業が発生します。
しかし、スタンドアロンで作業している時はオケは鳴っていないので、実際にオケに混ざった時の音は勘で予想するしかないのです。

ぶっちゃけ、音声合成ソフトに不慣れな事もあって、ここをもうちょっとこうしたいとか、細かく修正したいという場面が頻発するので、その度に音声合成ソフトに戻って修正しては音声ファイル書き出しという作業が発生すると、莫大な時間を食われてしまいます。

VSTプラグインとして動作すると、修正したらその場で反映されてリアルタイムで確認ができます。特に初心者にとっては挫折してしまわないためにもこの要素は非常に重要だと思います。

思ったよりピッチがズレる

僕の勝手なイメージとして、機械が音程を外す訳が無いという思い込みがあったのですが、予想に反して結構外します。
特にライブラリーによって得意な音域と不得意な音域があるらしく、不得意な音域では外し方が顕著になります。

裏技的な方法で、得意な音域で打ち込んで後でピッチを変更するというやり方もあるようですが、基本を押さえ切れていないうちは手を出さない方がよさそうな気がして試していません。

このピッチ補正の作業が地味で根気のいる作業となるので、ここでもう心が折れそうになります。

音声合成ソフト特有の摩擦音

人間が歌った時でもサ行等の音は耳に刺さる場合もありますが、音声合成ソフトではタ行やサ行で特有の機械的な摩擦音が発生する場合があります。
これがなんとも耳障りな不快な音でして、何とか取り除こうとしたのですが、発生タイミングをずらしたり、摩擦音部分のボリュームを下げたり、EQでその不快な音の周波数帯をカットするなりしてある程度回避できましたが、自分の現在の技術ではまだまだ回避しきれていません。

皆凄かった

昨今のSNSなどを見ていると、DTM初心者の方々でも音声合成ソフトを使いこなしている方が大勢いらっしゃいますが、改めてこんな難しい事を皆やってのけていたのかと思うと頭が上がりません。

一応今回作った曲を張り付けておきます。
後で見返した時に成長を感じられるようになっていたいですね。


この記事が気に入ったらサポートをしてみませんか?