![見出し画像](https://assets.st-note.com/production/uploads/images/128318245/rectangle_large_type_2_1f76cde72ff937b9ac3ecebb383f7c84.jpeg?width=1200)
一滴の雫 4 ボカロで声を入れました
最近の音声合成技術はかなり進んでいて比較的自然な人間の声に近い抑揚を付けて話したり歌ったりしてくれます。
もちろん不自然な部分は残っており、ほとんどのケースで合成音声だと分かります。
とはいえ会話やポップス系の歌声だと本当に人間が喋ったり歌ったりしているように聞こえるケースもあります。
こんな歌声です
私が操作に慣れていないということもあり、どうしても本物のソプラノ歌手が歌っているような感じにはならないのですが、下記リンクの上の方にありますので宜しければご試聴ください。
オリジナルソング - 明け方の民の調べ (dolphy.verse.jp)
AI技術の恩恵
AI技術を使って自然な会話や歌い方の特徴をうまく取り入れることができるようになったことが大きいのでしょう。
一般にはボカロとかボーカロイド(Vocaloid)と呼ばれておりますが、これはヤマハが開発した音声合成技術やその応用製品を指す言葉です。
最近はヤマハ以外にも音声合成技術を使った製品が登場してきており、今回はその一つである Synthesizer V(AHS)を使ってみました。
母体のDREAMTONICS社は台湾の技術者が日本で立ち上げた企業で、日本語、中国語、英語の会話と歌声に対応した各製品がラインナップされています。
もちろん有料製品が中心ですが、Synthesizer V Studio Basicとライト版の各データは無料でダウンロードして使用することができます。
Synthesizer V Studio Basic 及び 各種Synthesizer V Lite版ダウンロード|製品情報|AHS(AH-Software)
AI版と非AI版があり、AI版の方がより自然な歌声が得られることが多いようです。
比較してみたところ、確かにポップス系の歌であればAI版の方が自然な感じが良く出ていてものによっては人間が歌っているとしか思えないようなものまであります。
意外な結果
しかし、今回私が適用したクラシック系の歌ではAI系は全然ダメでした。
ポップス系の歌はいっぱい学習しているのでしょうけれど、クラシック系は発声方法や歌い方が違います。
ポップスを歌う時の癖がでてしまって、かえって不自然な歌い方になってしまうのでしょう。
それで今回は非AI版のSakiというデータを使うことにしました。
非AI版ですとどうしても直線的で機械的な歌い方にはなってしまいますが、細かい修正を加えていけば良くなるのではないかと思います。
今回は私の経験不足により最低限の修正しか加えることができませんでしたが、我慢しながら何とか聴けるレベルにはなりました。
積極活用を検討します
最近の合成音声をお聴きになったことがあると思いますが、本当に凄いですね。
特にAI技術を応用した製品になると人間の声との違いが殆ど分からないくらいです。
![](https://assets.st-note.com/img/1705820326463-Ob01PKWxnA.png)
今回のケースでは今一つでしたが、ポップス系のオリジナル曲をこれで作っても良いのではないかと思います。
もちろん万能ではありませんけど、デモテープなら十分作れそうです。
おしまい
最後までご覧いただきありがとうございました。この投稿が良かったと思われた方はスキ❤をぽちっとお願いします。フォローもよろしくお願いします。
この記事が気に入ったらサポートをしてみませんか?