見出し画像

合成音声音楽の「人間っぽさ」と「人間らしさ」

夏のお休みにはいったさかじょんです。
最近お仕事いっぱい!のため投稿があまりできておらずすみません! 書きたいな~というネタはいくつかあるので、このお休みの間に多少書き溜めておきたいとは思っています。

いや~ボカコレでしたね! 期間中にはあまりたくさん聴き切ることもできず、~500曲くらいしかチェックしていないのではないでしょうか……。普段よりは聴いていますが、にしても曲が多い。今も続きを聴いています。

さて、今回はそんなボカコレで出会ったcamel-leonさんの「glitter」を聴いていて思ったことです。
初音ミクの話ではありません。なんということでしょう。


VOCALO CHANGERというやつ

「glitter」はGUMI歌唱ですが、歌声からおそらく「最近のGUMI」だろうな~と思いつつ聴いていたところ、クレジットには「VOCALO CHANGER機能にて調声」とあります。

恥ずかしながら作り手ではないため、VOCALO CHANGERというのを初めてちゃんと認識したのですが、ググってみる限りVOCALOID6に実装されている「人の歌声を合成音声に変換する」機能であろうかと思います。

https://www.vocaloid.com/vocaloid6/

機能の概要やどんな感じかは以下の記事に詳しいです。

また、「glitter」は(GUMI歌唱に変換する前の?)七海うららさん歌唱バージョンも投稿されています。

聴き比べてみると、確かにこちらの人間歌唱の歌い方のクセみたいなのがGUMI歌唱に落とし込まれているような印象も結構ありますね!

「人間っぽさ」と「人間らしさ」の表現

そんな「技術の進歩ェ……」という感じのVOCALO CHANGER機能ですが、これは「人間っぽさ」の限界突破としての表現の在り方なのかな、と感じていました。

音声合成は、打ち込んだ音素や音程を「そのまま歌い上げる」形から、AI合成音声と称して「いい感じに歌い上げる」形へとみるみる発展してきました。
そんな中、Vtuber界隈などではとっくに一般的なものなんでしょうが、リアルタイム音声加工(いわゆるボイチェン)の展開も進み、じゃあ歌声データを「合成音声」に変換できるじゃん、というのもまあ普通な発想と言えそうですね。

少し脱線しますが、「人の歌声を合成音声に変換する」、人間の変な欲望が現れている感じもして、これはこれで面白いですね……。今まで一つの流れ(主流、といっても過言ではないと思います)として「人間の声を再現する」という潮流があった合成音声が、「人間の声を合成音声に変換する」のは、ともすると錯誤なのかも、と思いました。
あ~でも、これは「当事者とは違う人間っぽい声を生産する」という別の価値があるってことか(そりゃ、ボイチェンもそうだし)。じゃああんまり錯誤じゃないですね。すんません。

話を戻しまして、VOCALO CHANGERは「打ち込み」というデジタルなリソースを使うのではなく、「人間の声」というアナログなリソース(※)をソフトウェアにぶち込むという点で、ちょっと今までの合成音声音楽とは質が異なるのかなとも思いました。
(※:あくまで相対的にアナログというだけです。ソフトウェアに渡すためにはデジタルな配列にしなければなりませんが、打ち込みに比べるとキメが細かく、連続的に見えるという意味でアナログと言っています)

ところでタイトルの話にもなりますが、「人間っぽい」って人間には言えないの、お分かりいただけますでしょうか。「人間っぽいボーカロイド」は言えるけど、「人間っぽい人間」はちょっと言いづらくないですか?

逆に「人間らしい」は人間にも言えます。「人間らしい人間」は言えて、「人間らしいボーカロイド」はちょっと言いづらい気がします。

VOCALO CHANGERは、「人間らしい」人間の歌声を取り込むことによって、「人間っぽさ」の限界を超え、「人間らしい」の領域に合成音声を突入させようとする構図になっているとも捉えられるのかもしれませんね。

俺は……やっぱりV3・V4初音ミクやUTAUテトが好きだぜ……

でもねえ!!!!前も行ったけど俺は合成音声らしい合成音声が好き!!!!!(合成音声は合成音声なので、「らしい」が言えますね)

重音テトSVが登場したことによって、UTAUテトにも改めて注目が集まり、SVとUTAUテトのデュエット曲などが増えたのは個人的にはっぴーです。

ボカコレ夏では、//飴玉電圧さんの「プラズマワークス」が最高でした。主コメより「バーってビリバリーって感じの魔法少女モノ」だそうです。最高。

おわりです

今回は、ボカコレ夏で聴いた「glitter」から、VOCALO CHANGERについて見てきました。

私はいろんな理由で合成音声らしい合成音声が好きなので、VOCALO CHANGERも「すげ~」とは思いますが「好き~」とは思いません(これは技術・概念に関する言説であり、VOCALO CHANGERを使った楽曲を好きにならないという話ではありません)。

ただ、クリエイターの選択肢が増えるのはいいこととも思います。誰(ライブラリ・ソフトウェア)に歌わせるのかだけでなく、どういう手法(打ち込み・VOCALO CHANGER)で歌わせるのかの選択を、クリエイターができるようになるということですし。

そうなってもなお、クリエイターがバチコリ合成音声を使ってくれるタイミングがあれば、私は陰ながら喜んでいると思います。笑

「人間っぽいこと、人間らしいこと」だけが合成音声の価値じゃないよ、ということはこれからも言っていきたい次第です。

とまあ少し長くなりましたが、今回はこの辺で。スローペースの投稿になるかもしれず恐縮ですが、のんびりお付き合いください。今回も最後まで読んでいただきありがとうございました。

モチベが上がります(当社比)