音声配信における編集【声の仕組み】

2024年1月25日 21:10

今回のテーマは「音の切り方」についてお話ししたいと思います。
音声配信の編集で欠かせないのは音声データの切り貼りですが、みなさんはどこで音声を切ってますか？

音声を切る場所は喋ってる場所じゃない

音声配信で「編集」と言えば、往々にして収録音源の切り貼り作業が伴います。
でも、音声を切り貼りしていると「なんだか違和感があって上手く繋がらない…」という経験をされた方も多いはずです。
同じ話者、同じ環境の音声なのになぜ声の繋がりに違和感が出るのでしょうか？
それは発声の仕組みに反した音声編集をしているからかもしれません。

普段何気なく喋っている私たちも実は数多くの工程をこなして声を出しています。

肺から空気を送る(呼気)
声帯をふるわす(純音)
喉、鼻、口で響かす(共鳴)
口で音を形成する(形成)

もちろん無意識ではありますが、人が発声をする時はこの工程をこなして発声をしています。

音声の編集ではお馴染みの波形データとともに説明をしていこうと思います。

予備動作

ピッチャーがボールを投げる前に振りかぶるのと同じように、特定動作の前には必ず予備動作があります。
口から声が出る前には口器官で形成をしていて、形成の前には共鳴・修飾していて、その前には純音があって、その前には呼気の発生があります。
そして呼気を生み出すために息を吸う必要があります。

上記画像の「さぁ」に当てはまる音を編集で切り出したい場合にみなさんはどこで切り(編集点・開始点)ますか。

先に不正解を言いますと下記画像の場所です。

なぜ不正解かはお気づきの通り予備動作を無視しているからです。
工程抜きに最終目的の発声部分だけを切り出したため、違和感のある音声になります。

「さぁ」の部分を切り出したい場合は発声の予備動作(発声前の空白部分)から切り出しをした方が、我々が普段聴いている人間の自然な発声に近い音になります。

余韻(反響、残響)

発声の仕組みでもお伝えした通り、人間の声は生成の段階で共鳴しています。
共鳴はわかりやすく言えばお風呂場で話しているような感覚のこと。
つまり、声を出した後には必ず余韻が残ります。

前項では発声する前に編集点を入れましたが、発声した後に切る場所も発声直後ではなく、余韻を意識しましょう。

対処方法

以上のことを含めて切り抜きの正解を考えると、以下の場所が正解の切り抜き場所になります。

たった一言を切り出すにも予備動作と余韻を意識するだけで違和感を大幅に減らすことができます。
みなさんもぜひ予備動作を無視した切り抜きと、余韻を無視した切り抜き、予備動作と余韻を考慮した切り抜きの3パターンを聴き比べてみてください。

人間は予備動作と余韻のある音声に慣れている

普段何気なく話して、何気なく聴いている声だからこそ、聞き慣れない発声を聞くと違和感があります。
AIが生成した音声に違和感があるのはイントネーションが関係していることもありますが、発声された音声と次の音声との間に予備動作と余韻がないことも大きく関係しています。

コンプレッサーで音を潰してあえてブレス音(息を吸う音)を作らない手法もあるので、一概に正解はありません。
いろいろな編集方法がある。ということを知っていただいて、自分が表現したい音源制作ができる一助になれば幸いです。

この記事が参加している募集

#わたしとポッドキャスト

3,770件

この記事が気に入ったらサポートをしてみませんか？