見出し画像

時々音楽を作るけど

合成音声の進化ってすさまじいなと思っている。Vocaloidが代表格ではあるけれど、かの有名な「初音ミク」の前にはMeikoやKaitoがいた。

ただVocaloidと名乗らなかっただけでYAMAHAのDTMソフトウェア等には結構昔から「歌詞に合わせて曲を歌ってくれる機能」が搭載されていた記憶がある。(確かHello!Music!シリーズあたりだった気がする。確か歌手の性別も選択出来た記憶がある。)

その「結構昔」が確かWindows Vistaさえ正式サポートではなかったレベルの昔。XPが対象だったかすら定かではない。自分にとって合成音声の原体験は多分この辺りなのだ。割とポルタメントが激しくついていたり、全体的に「ぼやっ」とした感じのボーカルだった一方で、ちゃんと言葉が聞き取れるように歌ってくれることに驚いた記憶がある。

下手の横好き、という言い方にはなるが自分も音楽は時々作成するし、Youtubeやニコニコ動画などで投稿もしている。余裕がないと作る気が起きない、という良くない傾向はあるが、やっぱり作った以上は色んな人に聴いて欲しいと思ってしまうんだよな。

で、上記のYoutubeの楽曲はGUMIと呼ばれている音源が歌ってくれているんだけど、割とUTAUというカンパウェアを愛用していた時期も長い。分かる人には分かると思うが、音源で言えば「松田っぽいよ」や「重音テト」を用いることが多かった。

GUMIにせよ初音ミクにせよ有償のソフトウェアだしそれは勿論健全な音楽シーンの発展に必要な金銭だ。一方でUTAUは実質的にフリーウェアのような扱われ方をしている様子もあって、合成音声、もといVocaloidが台頭した時期にVocaloidのそれとは異なる層を拾い上げてくれたんじゃないかなと思っている。

で、今がどうなっているかというとsynthesizer Vやneutrinoといった新しい合成音声ソフトウェア群が表れていて、しかもそれらの品質がめちゃくちゃ高い。

平たく言うとディープラーニングを主とした機械学習がVocaloid周りのシーンに大きく影響を与えている。しかもneutrinoは導入に多少の壁はあれど実質無償で扱えるソフトウェアとなっているし、GUIを完備した打ち込み用ソフトウェアを有志の方が作っていることもあって、UTAUユーザー等はほぼ違和感なく使用も出来るだろう。synthesizer Vだって「ライト版」という、一部制限はあれど音楽制作~発表まで可能な音源群を配布している。

ボーカルをしていた身としては「まだ人間ではない」と思う部分はあるけれど、パッと聴かされて瞬時に判断できるかというと自信はない。それ位のレベルには到達している。

Youtubeだったりニコニコ動画だったりで申し訳ないが、これは前述のneutrinoを用いて作成した楽曲だ。一聴してどうだろうか。人間にしか聴こえない、という人も多いのではないかと思う。だけどこれ、「メロディーを用意して歌詞を打ち込んだ」以上のことはしていないのだ。それでもこれ位は歌ってくれる。

とりあえず取り留めもなく書きなぐったみたいな文章になってしまったが、Vocaloidという表現で括られてしまいがちなこうした合成音声って、実は非常にバラエティに富んでいてしかも進化が凄まじいことをお伝えしたかった。

…自分は元々ボーカルをしていたのでこの進化の凄さから来る焦りがないわけではない。ただボーカル以外の音源だって進化は凄まじい。今回紹介した2曲は生楽器を一切使っていないが、実際1曲目は「恐らく生ドラムだろう」と紹介してくださった方までいた。

そう考えるとこういう進化はあるべくしてあるし、こういう進化が音楽の間口を広げるならばとてもいいことだと個人的には思っている。

え、なんか記事として何が言いたいか分からないって?
そりゃそうだ。4日目にして早くもネタ切れと、曲を作らなければいけないことへの現実逃避で書いたんだから。たまには許してくれ。

この記事が気に入ったらサポートをしてみませんか?