見出し画像

〝人〟でなければ出来ない音声表現って何だろう❓🤔

 AI音声による表現の可能性については、この記事の対象であろう若い皆さんには改めて説明する必要もないでしょうね😄。ボーカロイド(ボカロ)と言うソフトウェア音源(と言う言い方が正確かどうかは謎🤔)の普及は明らかにそれまでの表現活動の概念を変えました。これに関しては色々な切り口がありすぎて、私には包括的に語る事は難しいので、その中でも一番本質的な表現媒体としての人との関係性(相対性かも知れない🤔)と言う観点でお話をしたいと思います。
 ですがその前に、もしかしたら今お読み頂いている方の中に「ボカロ⁉️ナニ、それ❓おいしいの❓🙄」と言う方がいらっしゃるかも知れませんので、まとめ記事を引用しておきますね👇。

🗣なぜアプリに歌わせるの❓🙄

 ボーカロイドと言うアプリが世に出た時に、私はとても興味を持ちました。自分の歌にボカロでコーラスを付けたいと思ったからです。それまではハモりもコーラスも自分で歌っていて、これは意外と手間と時間がかかって面倒くさかった。でもキーボードを扱えない私がボカロを使いこなすのにはそれなりの知識や経験が必要だと知ってすぐに諦めました。だって自分で歌った方が楽で早いと分かったから😅。
 そうこうしているうちにハーモナイズに特化したアプリやプラグインが登場したので、私のボカロへの熱は一気に冷めました😅。ですが〝誰もがアーティストやアイドルをプロデュースできるソフト〟と言う意味ではずっと注目していました。実際に予想通りの展開にもなりましたので、本質的な捕らえ方としては間違っていなかったのだろうと自負しています😄。
 あ、蛇足ですが、科学の力😅でハモっている楽曲をオフィシャルサイトで公開しています。どれが生声で、どれがプラグインのコーラスか分かるかな❓😄

 さて、ボカロの善し悪しとか好き嫌いに関しては皆さんそれぞれにお考えがある事と思いますし、それは全くもってその通りなのだろうと思いますので😅、ここではその事には触れません。それよりも、ボカロによるこうした表現が人による表現と同じように多くの人の心に届いて行動を促していると言う現実を、私は重く受け止めています。そしてその状況を見た時に、表現者として当然に考える事があります。

🗣人が音声表現を演る価値とは一体何だろう❓🤔

 芸能文化芸術における「表現とは何か❓」に関しては色々な考え方がある事でしょう。役者を例にして「表現者」と言った場合は、表現媒体の人と表現主体の人の両方を含みます。通常私は「表現媒体として演じる人」と「表現主体として演じる人」は分けて考えています。前者は職人であり、後者は芸術家であって本質が違うからです。勿論兼ねている人も少なからずいますがね😄。
 ここでは「表現(演じる)とは、見聞きした人(お客様)に演った事が意図した通りに正しく伝わる事」であり、「表現者(俳優・声優)とはそれが出来る人」であると言う前提でお話を進めていこうと思います。ですから、どちらかと言えば表現媒体としての俳優・声優の話になろうかと思います。ですので伝えるべき内容や質については今回はあえて触れません。それは表現主体として求められる全く別の問題ですからね。

 話を戻しましょう😅。俳優・声優としてお客様に何を伝える必要があるのかと言えば、意味・情報・意志・価値観・感情など様々なものがありますよね。それらが複雑に絡み合って作品のメッセージとして伝わる訳です。中でも音声表現は、それだけでも伝えられるものが多様ですから、かつては「音声表現は人でなければ充分に役割を果たせない」と思われていました。
 所が技術の進歩で合成音声がリアルな人の声に近付き、更にAIの活用でより人に近いイントネーションやアクセントで発音出来るようになると、天気予報・交通情報・ニュースなど「意味や情報が伝われば良い」と言う場合にはAI音声でも充分に役割を果たせるようになりました。現に色々な所で実用されています。例えばこんな感じ👇。

 このナレーションはVOICEPEAKで作ったものです。VOICEPEAKは文字を入力すると指定したキャラクターが読み上げてくれるソフトです。このソフトでは喜怒哀楽のパラメーターを変化させる事も出来ますし、読み上げスピードや間の取り方、イントネーションやアクセントも調整出来ます。しかも直接オーディオファイルに書き出せるのでスタジオは愚かマイクさえ必要ありません(これ超便利‼️😉)。さらに凄い事に、これで作った音声は商用利用も認められています。こんなソフトが24,000円ほどで買えるのです(価格はこの記事の公開時点)。

🗣AI音声と共演も出来ちゃうよ❣️😅

 実験的にこのソフトで作った音声と私・石野竜三が共演している作品がありますので、ちょっとお聞きください😄👇。

 これはライブのアーカイブで、効果音とナビコの台詞を自分で出しながら私一人で演じたものです。お聞きの通り、既に作品によっては生身の俳優・声優とAI音声との芝居が成立するレベルまで来ています。これを聞いた語り芝居プロジェクトの若い衆は「ヤバい」とビビってました。まぁ、極めて常識的な反応だと思います😅。

 このVOICEPEAKは大変によく出来たソフトですが、それでもまだまだ苦手な事もあります。例えば〝笑う・笑いながらしゃべる〟〝泣く・泣きながらしゃべる〟〝絶叫する・絶叫するようにしゃべる〟などの表現は出来ません。喜怒哀楽も「雰囲気としてはそんな感じだね〜😄」と言うレベルで大きな表現は出来ません(いずれも本記事公開時)。それでも作品によっては芝居の合い方として充分に使えます。少なくとも「合成音声」=「棒読み」と言う認識は既に「古い❗」と言わざるを得ない所まで来ています。

🗣それじゃぁ、人はどうする❓🙄

 さて、こうしたAI音声の進化はこの先も止まる事はないでしょう。そうなると初音ミクのライブが大成功したように、朗読劇などで同じ現象が起きないとは誰にも言えません。違和感がなく、必要な要件を満たし、お客様の心もつかめて、しかも圧倒的なコストパフォーマンスを誇るとなれば、生身の俳優や声優の活動の場は確実に狭くなるでしょう。

 そりゃそうですよね。なにしろAI音声は、キャラクターとして歳は取らないし😅、進化(アップデート)はしても衰える事はないし、どれだけ喋ってもギャラ(ソフトの値段😅)は同じだし、いつでも何時間でも喋ってくれてスタジオを押さえる必要さえないのです。助詞一つを差し替えるだけでも簡単に対応出来るし、毎回同じ秒数で喋ってくれます。しかもどれだけこき使っても文句も言わず😄、スキャンダルとも無縁なのですからね😅。初音ミクが永遠のアイドルとしての地位を築いたがごとくになる日が来たとしても全く不思議ではありませんし、それはもうすぐ実現するかも知れないのです。

 と言う訳で、綺麗にしゃべる・可愛くしゃべる・格好良くしゃべると言うだけなら既に人が演る必要のない時代になっています。それでは生身の人間は一体どこを目指したらいいのでしょうか❓生身の人間が演じる意義や価値はどこにあるのでしょう❓もしくは、そう言う意義や価値自体が徐々に薄れていくのでしょうか❓

 これは、これから俳優・声優を目指す人は勿論の事、既にプロとして活動している我々も考えざるを得ない問題だと私は考えています。



この記事が気に入ったらサポートをしてみませんか?