比較歌声合成ソフト論 第1回「導入」

皆さんこんにちは。くろ州といいます。この講義シリーズは「比較歌声合成ソフト論」です。お間違えはないですか? 「比較歌声合成論」ではないですのでご注意ください。

はい。では始めましょう。

この講義シリーズは、現在利用可能な歌声合成を集めて、技術的・文化的に分析することで歌声合成ソフトウェアについての理解を深めようということを目的としています。大丈夫ですか?

この時点でそこそこ難しそうな雰囲気を感じ取っている人もいるかもしれないですが、この講義かなり難しいです。難しくなる予定ではあるんですが、一応事前に必要な説明は一通り行っていきますのでどうにか頑張ってついてきていただきたいです。

さて、この「比較歌声合成ソフト論」という講義タイトル。皆さん見たときにどういう内容だと思ったでしょうか。いろんな分野で「比較○○論」という分野・講義はほかでも見たことあるでしょう。これは事物Aと事物Bを何かしらの観点で比較し、それを通してそれぞれへの理解を深める・結論を見出すという試みです。

簡単に行ってしまえばAとBを比べてどこが同じでどこが違うのか調べていろいろ言おうということです。

今回は要するに「歌声合成ソフト」を比較して同じところ違うところ探してみようということになります。予防線を張っておくと、これは「VOCALOIDとUTAUを比べて優劣を競おう」という企画ではないのです。誰も幸せになれないので。

例えば、現在公開されている歌声合成ソフトをソフトウェアの「形態」という点でとらえてみましょう。この基準で言うと、VOCALOID EditorとUTAUは「スタンドアロン型」という同じ類型に入ります。そのうえで、VOCALOID Editor for CubaseやPiaproStudioは「プラグイン型」、SinsyやRenoidPlayerのような「ブラウザ型」に分類できます。この点で見えてくるのは「オリジナル曲に使われるソフトとカバー曲に使われるソフト」の違いだったりします。

比較・カテゴライズのための視点は「形態」のほかに「合成方式」、「キャラクター性」など様々あります。そのような指標を以て数ある歌声合成をカテゴライズしカテゴリ単位で比較することで、ナーバスな問題を回避しながら論を進めていこうという魂胆が隠れています。

このようにカテゴライズして比較する方法と、個別に比較する方法とでは見えてくる結果は違ってきます。このシリーズではカテゴリごとに比較するので、個別に比較しないとわからない結論を導き出すことはできませんが、そちらはまたいつか機会があれば。

では、やっと本題に入るとしましょう。この講義シリーズでは数多くの歌声合成ソフトの名前がうじゃうじゃ出てきます。そのほとんどは現在無料で利用可能なものになっています。さすがにVOCALOIDとCeVIOは有料だから抜かすというわけにもいかない程度に影響力の強いソフトであるので数えていますが、できる限り無料のものは集めました。

そのうえで、可能なものは自分の手で使ってみました。個人的な拘りでしかないですが、できれば体験してから語りたい性分なもので、触らずに机上論を垂れ流すのは気が重い。アフリカの部族を研究するのならその部族の生活を体験したいタイプです。

もちろん外から見るからわかることもあり(エティックな観察)、それの良さもあるが、私はこの講義を始めようと思った時点ですでにどっぷりはまり込んでしまっていたのでもはや外からの観察がさっぱりできなくなってしまった。結構痛い部分がある。痛い部分はあるが、おそらくこの分野において使い込んだうえでの(イーミックな)比較研究ができる人は貴重かと思うので人柱としても精進したいところである。外からの観察はこの講義に対するフィードバックから補っていきたいと思います。

話がそれてしまいましたが、そんなあまたの歌声合成ソフトをカテゴライズし、比較研究していくこの講義の各回の予定を示しておきましょう。

第1回 導入
第2回 歌声合成ソフト紹介1
第3回 歌声合成ソフト紹介2
第4回 ソフトの形態
第5回 合成方式
第6回 キャラクター性
第7回 音源制作
第8回 タグ・ユーザー・インストール難易度
第9回 まとめ

次回から2回ほど、比較対象となる歌声合成ソフトを一つ一つ簡単に紹介していきます。30個以上紹介するうちの20個以上はこれを見ている皆さんのPCでも動かせるでしょう(WINのみ対応のソフトが大半だが)。もし興味を持ったならば使ってみるのもいいかもしれません。

それ以降の議論では特に説明なくこれらのソフトの名前を用いていくので、理解はしなくていいですが、スペックをある程度覚えておくのがいいかもしれません。もちろんテストはないですが、話についていくのにテスト並みの記憶力が求められます。聞いたことのないものが多いほど。

話は基本的に技術的な部分をメインに進めていきます。技術と文化を分けて考えることも重要だが、私はそのはざまにいるものとして両者のかかわりも意識しながら進めていけたらよいと思っています。

ここまでをまとめると

・多くの歌声合成ソフトをカテゴライズして比較
・共通点や相違点を洗い出してみる
・使ってみた側の視点から

ここまできて暴露すると、この内容はすべて私の経験に基づくものであり偏りも出てくると思います。これが正しいことだという風には思わず、これを素材として各自議論してもらうのが良いのではないかと思います。

あ、そういえば私の自己紹介してないですね。私は世界の歌声合成ソフトを見つけては使い見つけては使いして歩いているマニアです。たいていの場合はカバーをしているか、このように記事を書いているか、歌声合成音源を制作しています。そういう人間のバインドがかかった内容になるということは気を付けていてください。私のブログは歌声合成ソフト大事典のようになっています。

第1回の最後に、次回以降見ていく歌声合成ソフトの一覧をあらかじめ上げておくので、予習したい場合は検索してみてください。私のブログで検索するとほとんどあります。

・VOCALOID
・UTAU
・CeVIO
・Alter/Ego
・Aquetone
・Cadencii
・ディレイラマ
・EmVoice
・HANAUTAU
・LaLaSong
・MikoVoice
・MUTA
・My MidiVocalist
・Nakloid
・なめうぇーぶ
・NIAONIAO
・OpenUTAU
・PiaproStudio
・Renoid
・Sharpkey
・Sinsy
・SugarCape
・SynthV
・歌うボイスロイド
・UTSU
・v.Connect-STAND
・VOCALINA

加えて、一般ユーザーに開放はされていないもの、有料音源も少し扱います

・ボイスメイドプロジェクト
・VoiceTEXT
・りんな
・CANTOR
・CANTUS
・Soloists Of Prague

ではまた次回。

この記事が気に入ったらサポートをしてみませんか?