見出し画像

無料から始める歌モノDTM(第24回)【調声編⑤発音その2・ゴーストノート調声】

はじめに

はじめましての方ははじめまして。ご存知の方はいらっしゃいませ。
ノートPCとフリー(無料)ツールで歌モノDTM曲を制作しております、

金田ひとみ

と申します。

【調声編】6回目です。
改めて基礎回を未読の方は、一読をオススメします。かなり長いですが、私の調声の方針になります↓

【調声編】全体の流れです↓
終わったところは取り消し線を引いています。
(子音・母音という枠組みは、前回の歌詞入力と今回の話題を含みます。)

<歌声>:音声、音価・音高、トランジェント・アタック等について
<発音>:子音・母音、フォルマント、ピッチガチャ、ブレス等について
<抑揚>:ビブラート、コブシ、シャクリ、フォール等について
<効果>:エフェクター、ハモ等について

順番はDTMer/ボカロPに馴染みやすいであろう、DAWでの曲制作順に則っています。
以前の記事は最下部の「前の記事」から、またマガジンとしてもまとめていますのでそちらからご参照ください。

<発音>2回目は以前からジワジワご紹介しておりました、NEUTRINOユーザー向けの調声の裏技、

ゴーストノート調声

です。
どうやら楽しみにされている読者さまもいらっしゃって嬉しく思います。
一応、私の使っているバージョンのNEUTRINOでの裏技になりますが、細かいタイミングやダイナミクスを調整できる機能があれば他歌声ソフトでも似たような操作は可能かもしれません。

応用範囲を広げれば、現実の歌手、いわゆる「歌ってみた」などで活動している歌い手さんにすら有効です。というか表現力の高い歌手はおそらく気づかないうちにやっているのではないかと思われます。
以前【作詞編】で紹介した宇多田ヒカルさんの『First love』でも同様の効果を(無意識的にか意識的にかわかりませんが)使っているのを確認しました。記事の後半で紹介します。

今回、ゴーストノートそのものの解説もしておきます。
本来なら【制作編】【打ち込み編】なんかの別タイトル名でやるところでしょうが、この際ついでに触れておきます。
ゴーストノートについてすでに十分詳しい方は、前半飛ばしてもらっても構いません。なにせ今回の記事、2万5千字ほどあるので。

私は歌声も楽器音と同じようなものとして捉えています。
ですので、すでにゴーストノートを知っていてDTMでの楽器演奏の再現にこだわる方、応用力のある方、勘の良い方なら「ゴーストノート調声」という単語だけで理解できて、解説すら必要無いんじゃないかとすら思うくらいです。
が、それではあまりに不親切なのでまずはゴーストノートとは何かというところから始めます。

ゴーストノートとは

そもそも
ゴーストノート
とは何かご存知でしょうか?
DTMをある程度やっている方であれば耳にしたり実践したりしていると思われますが、正確性を保つためいつものごとく定義を明確にしていきます。

一般的なDTMにおけるゴーストノート

「ゴーストノートとは」で検索してトップに出てきた分かりやすそうな解説サイトをとりあえずいくつか引っ張っておきました↓

上のサイトの解説を読まれても良いですが、長いので簡単にまとめると、
主にドラムス、ベースギター、ギターなどの演奏で使われる、鳴ったか鳴っていないか分からない程度の音量、不明瞭な音程の装飾音符
のことです。

ゴーストノートは英語では「Grace note」(グレース・ノート、グレイス・ノート)とも言うそうです。
Graceは「飾る、飾り付ける」といった意味、noteは「音符」のことなのでまんま直訳で「装飾音符」のことです。
聴こえるような聴こえないような不確かな感じからゴーストと呼ばれているのではないかと思われます。キャッチーなネーミングですし。
(今更ながら、「note」の元々の意味が「音楽の音を記したもの」=「音符」のことで、この記事を書いている「note」はそこから派生した「ノートブック」(雑記帳)が由来だと思われます。「本とノート」の意味のノートは英語圏で派生したあと付け。日産のコンパクトカー「ノート」は音符と雑記帳の両方の意味を掛けたものらしい。雑学大好き。)

また、演奏していないのに聴こえる音、と定義しているものもあったので、いろんな意味で不確か。それは幻聴と言うのでは……?
幽霊音符……?(((;゚Д゚)))

Wikipediaでゴーストノートを調べると、装飾音の一種と出てきます。

装飾音の一種。主にギタードラムの演奏において用いられる。「ゴーストノート」という呼称は和製英語で、正しい英語ではGrace noteと呼ばれる。しかしアメリカ人であるJeff Porcaroが自身の教則ビデオでGhost noteと表現している

https://ja.wikipedia.org/wiki/ゴーストノート

Wikipediaを読むのは好きなんですが、続けて「装飾音」の項目に飛んでもゴーストノートの解説は無いのでこの解説だけでは適切な気がしません。

音楽用語全般で装飾音の定義になると、トリル(ピッチを素早く上下させる演奏法)やアルペジオ(和音の構成音をばらした演奏法)まで含まれてしまうので、ここでは「装飾音符」と呼んでおきます。

ドラムスのスネアのロール奏法、いわゆる「ドラムロール」(ドゥルルル……やザザザザッ……と鳴る細かく叩くやつ)も広い意味では装飾音になるかと思います。
ドラムロールは打楽器におけるトレモロ(同ピッチ音の小刻みな持続)に分類されます。
打楽器は一音ごとのボリュームの減衰が早いので、長く音を鳴らす、つまりサスティンを得るためには細かく打ち続けて疑似的に伸ばすという演奏法を取ります。マリンバなんかの木琴楽器でもやりますね。
対して、ゴーストノートは「聴こえないくらい小さくとも一音符一音符が意味を持って確かに存在している」音です。いくつかの音のまとまりではなく、一音符ごとに意図的に鳴らします。

DTMにおいては、ドラムスやベース、ギターの演奏をリアルに再現するために「ごく小さなベロシティで打ち込むノート」といった意味で捉えられているかと思います。
先のスネアの「ロール」はドラムス音源によってはひとまとまりの装飾音パターンとして最初から用意されていたりします。(便利なようで結局は曲の拍や表現に合わせて手打ちすることも多々ありますが。)
一方、ゴーストノートは1つ1つの音符のことなので、どこにどれくらいの強さで打ち込むかは自分で決めていかないといけません。

ギターやベースの場合、音源によっては最初からキースイッチなどでゴーストノートと指定して小さなパチッと鳴る音を打ち込むこともできます。
上掲サイトをご参考いただくと分かりますが、ただ弱く弾くのとゴーストノートとして弾くのはそもそも指の動きからして違っていたりしますので、ベロシティ調整ではなく奏法ごと変えることもあります。
ギターやベースは指先だけでなく両手のいろんな箇所が弦に直接触れますので、触れ方、触れる場所、離し方やそのタイミングなどで驚くほどの奏法のバリエーションがありますが、今回の本題と離れてしまうので詳細は省きます。数本記事が書けてしまう。

ゴーストノートとグレースノートの違い

もう少し突っ込むと、ギターやドラムスでいうところのゴーストノートと、その他の楽器や音楽全般での装飾音符/グレースノートはニュアンスが若干異なります。

ドラムスやベースいうゴーストノートは、主にジャズ、ファンク、ロック、ソウル、R&Bといったジャンルで、グルーヴ感、要はノリのイイ感じを出すために入れられることが多いようです。
Groove(グルーヴ)」自体、近年生まれたやや曖昧な概念で、上記ジャンル以外ではあまり聞きません。英語ですので、演歌、童謡、歌謡曲といった日本独自のジャンルだとなおさら特別には意識されないと思います。
つまり曲ジャンルや目指す表現によっては絶対に入れなければならないというものでもない。
ただ現代の音楽は、ポップスやヒップホップなど別ジャンルであっても少なからずロックやR&Bの要素が取り込まれていたりするので、入れてはいけないというものでもない。
どう応用するかの選択肢は作曲編曲者やプレイヤーの目指す表現に委ねられます。

一方、グレースノートはもう少し広い概念です。ジャンルや楽器に関わらずさまざまな場面で登場します。
それぞれの違いを具体的に楽譜上の表記で確認していきます。

ドラムスの楽譜では音符+( )括弧で示されます。
主にスネアですが、ハイハットシンバルでも使います。

ドラムスの五線譜の場合の例。
ヘ音記号での第3間(下から3番目の間)がスネア。
赤丸で示した括弧の付いた音符がゴーストノート。

画像は上記サイト「リズム&ドラムマガジン【ドラマーのための用語集】-ゴースト・ノート」より
https://drumsmagazine.jp/notes/term-ghost-note/

上画像の赤丸で囲んだところが、スネアをゴーストノートで叩く、という指示。
あとでDAWで再現してみます。

ギター、ベースギターだと楽譜上の音符の玉が✕バツ印で示されます。弦の振動を止めるミュートと違って音が鳴らないように止めるのではなく、鳴らすけれどもパチッといった感じでどの弦のどのフレットかわからないような短く小さな音です。

ベースの場合の例。
上がゴーストノートを出す時に押さえる(であろう)指の位置を五線譜とタブ譜で示した例。
(タブ譜とはギターやベース専用の、弦とその弦で押さえるフレットを示した楽譜。)
ゴーストノートは音程が不明瞭ながら、押さえる弦やフレットによってニュアンスが変わる。

画像は上掲サイト「ベースマガジン【ベース初心者のための知識”キホンのキ”】-ゴーストノートを使いこなそう」より
https://bassmagazine.jp/notes/202304-beginner-15/

ギターやベースは奏法が多いので五線譜とタブ譜の二段構えで指示されます。
画像下段が実例で、この場合、3弦3フレットを、実音8分→ミュート16分→ゴーストノート16分→実音8分→……の順で弾く。
「ベ、ベン」を実音、「ん」をミュート、「ッ」をゴーストノートとすると
「♪ベンんッ|ベンんッ|んベッッ|ベンんッ」……余計わっかりにくっ(笑)

私もDTMを始めるまではゴーストノートという用語すら知らなかったですし、上の楽譜を見てもなんのこっちゃってレベルです。ドラムスもベースギターも遊び程度で触ったことはありますが、楽譜はスラスラとは読めません。
スラスラと読んだり実物で演奏ができないとしても、DAWに当てはめて打ち込むことなら手間と時間をかければ誰でも再現できる。データなので。便利な時代だなぁ。

先の「リズム&ドラムマガジン」のサイトから引用したドラムスの例をDAWで再現するとしたら以下の画像のような感じになるかと思います。

ノートの色がやや暗くなっているところ、
また下に表示されたベロシティを示すバーが極端に短いところが
ドラムスのゴーストノート。

上画像の打ち込み例を
①ゴーストノート有り→②無し→③ゴーストノートも同じベロシティ、
で連続して聴いてみてください。2回ずつ繰り返しています。
音が小さくて聴き取れない方はスピーカーのボリュームを上げるかヘッドホン等を付けて試聴してください。

実際の打ち込みの際はもっと細かくベロシティを調整したりするのですが、基本のベロシティを100としてゴーストノートを30~40程度で楽譜通りに打ち込んだだけでも、そこそこナチュラルでノリの良いドラムスに聴こえるのではないでしょうか。

2つ目のゴーストノートが無いものだとちょっとあか抜けない、素人っぽい感じに聴こえます。
機械なのでタイミングがズレたりしているわけではないのに、音と音の間(ま)があってノリが悪い。グルーヴ感なんて生まれなさそうです。

3つ目のゴーストノートまでしっかり鳴らしたものは単純に要らない音まで入っていてうるさいですね。それにあちこちに強い音があって、どのタイミングでノッていいのかよくわからなくなる。
現実でもこの実例のゴーストノートのタイミングで、同じくらいの強さでスネアを叩くのは逆に難しいと思われます。
強拍弱拍(表拍裏拍)が混じっているので、つんのめったような感じで拍が取りにくい。

どこでもここでもゴーストノートを入れればリアルな演奏になるわけではなく、
そのプレイヤーの無意識的なビート感がゴーストノートで表現されている
と考えた方が良いと思います。
DTMの場合、無意識的にではなく、実際に演奏するとしたらどこに入るだろうかと意識してノートを打ち込んでいかないとダメ。
私はドラムスを打ち込むときノートパソコンの前で両手両足振り回しています。はたから見たら変な人。
またバスドラムなんかでもゴーストノート相当の小さな音を入れる場合もあります。明確に鳴らしたというより勢い余って足が当たっちゃったみたいな。プロからしたらNGかもしれません。

でもビート感を意識できていないとビート)の規則性が崩れて拍子が成り立たなくなり、ひいては最悪、小節感が失われて構成までも破綻し音楽ではなくただの音の羅列にもなり得ます。グルーヴ感うんぬんのお話にすらなりません。あーコワイ。表面的なテクニックの弊害です。
なぜ入れるのか、入れるとしたらどこにどれくらいの強さで入れるのかを意識できないうちは、多少素人っぽくても明確な箇所以外で多用するのは控えたほうが無難だと思います。
(最近、リズム感という言葉は明らかにリズムを示していない限り使わないようにしています。音価パターン感と言ったほうが私的には理解しやすい。
メトロノームで刻む曲の全体的な速さはテンポ感、数小節ごとに繰り返される中での拍の感覚をビート感と私は呼んでいます。
以前【作曲編】で解説しましたが、テンポ、ビート、リズムは似て非なる概念です。)

それと、ナチュラルな音にはベロシティ(≒ダイナミクス)の差があることも再確認しておいてください。
たとえタイミングが合っていても3つ目の例のようにベロシティを適切に調整しないとナチュラルとは程遠くなります。
これは<音声>回のおさらいでもあります。

ここまではドラムス、ベースギター、ギターでの定義でしたが「装飾音符」全般、英語の「グレースノート」という広い定義で言うと他の楽器やジャンルにもあります。
どうやらゴーストノートのほうは、アフリカ系欧米人由来のノリが下敷きで、それが西洋音楽と融合して生まれたジャズやロックなどのジャンルで多用されているのではないかと思われます。
なので、クラシックなどの元々の西洋音楽にある概念の装飾音符/グレースノートとはニュアンスの違いがあるのかと。

クラシックなどの五線譜上での装飾音符/グレースノートは、
小さな音符スラー(別の音程同士をなめらかに繋ぐ記号)+通常サイズの音符
で下楽譜画像のように指示されます。

各1列目が楽譜上の装飾音符(赤丸で囲ったところ)で
2列目3列目が実際に演奏される2つのパターン。

画像はWikipediaより

楽譜の書き方からして違いますね。
画像を見ると、楽譜の見かけ上の音符と実際の演奏例の音符が結構違う上に、2パターンあるじゃんってなりますが、やはり歴史の長いクラシックの世界で積み上げられてきた定義はそれなりに厳密な取り決めがあるみたいです。それですらその曲自体の性質や制作された年代による解釈による違いもあるとのこと。

楽典レベルの小難しい定義や原則も調べてみましたが、ここでは、
はっきりと決まった音価はないメインの音符を装飾するもの
としてざっくり考えておきます。
(音大卒とかではない一般人なのでご容赦ください。)
ピアノなんかの演奏でよく聴く、複数の近い音程での「ポローン」みたいな音です。
「ポーン」と鳴る単音と違い、音の始まりの弱い「ポロ……」の部分に入る音と思っていただければ。
楽譜画像のパターン1の方をそのままDAWに打ち込むと以下の感じかと。

長前打音→長前打音→短前打音→複前打音→後打音のパターン1のほう

聴いてみてわかる通り、かなり違います。
3つ目の短前打音、4つ目の複前打音、5つ目の後打音が、装飾音符と言われて想像するものに近いのではないかと思いますが、1つ目2つ目の長前打音も楽譜の指示通りです。もはや違うメロディーですね。

曲や年代による解釈はあれど、これほど違いがあるなら最初から8分や16分や32分音符で指示すれば?と思うところですが、拍のタイミングと実際に聴かせたいリズムに乗ったメロディーは違っていたりします。

より分かりやすく一つ例を上げます。
下楽譜は前半は4分音符だけ、後半は短前打音付き4分音符で、もっとも単純に作ってみたものです。
(拍が分かりやすいようにメトロノーム用のクリック音を入れています。)

もっとも単純な装飾音符の連打。短前打音が付いてるか付いていないかの違いだけ。
Musescoreで自作。

拍としては前半後半どちらも4分音符4つなんですが、装飾音符が付くことで演奏のニュアンスが変わっています。
「♪ポーン、ポーン、ポーン、ポーン」
ではなく
「♪ポロ―ン、ポロ―ン、ポロ―ン、ポロ―ン」
といった感じ。拍は維持されています。
聴かせたいメインの音は「ポロ―ン」の「……ローン」部分であって、「ポロ……」の部分はまさに飾りです。

本来聴かせたいメロディーの直前にピッチやベロシティの音のゆらぎを与えて、メインの音符をちょっと遅らせる――いわばタメの演出で、よりなめらかにオシャレに聴かせることができるのがグレースノートと考えられます。後打音であればオシャレに締めくくれる。また次の音があるならその音より手前にゆらぎがあることでハシリのような効果も得られると思われます。
短前打音だからといってメインの音符の手前に短く入れるならどこでも良いわけではなく、曲によっては各拍の頭より先に演奏するのはNGで厳しく練習させられるのだそうです。
また装飾音符自体の音価は楽譜上は無いものとして扱われますが、メインの音符に対してどのくらいの音価かという取り決めはあるとのこと。2分の1、3分の2といった数値で音価が指示されます。
適当に早くor遅く弾けば良いわけではないみたい。ちゃんと拍を念頭に置いています。

DAW上で装飾音符に相当するノートを入れず実音だけをジャストタイミングで打ち込んだ楽器音は、なんとも素人感や機械的な感じがあります。
一方、グレースノートがあるとオシャレには聴こえますが、あまりあちこちに入れすぎるとそれはそれで「くどい」。
タイム・デュレーションやベロシティも考慮しながら意図的に入れていかないと、余計不自然にもなります。
由来はともかくグレースノートの「grace」には名詞で「優雅、気品」といった意味もあるのでオシャレ感やエモい感じを演出できる長所がある一方、やり過ぎれば「華美、派手すぎて似合わない」といった短所にもなりかねません。
現代歌モノ曲の伴奏なのにモーツァルトやショパンにピアノを担当してもらうみたいな。どっちが主役やら。

このへんでゴーストノートそのものの解説は終わります。
ゴーストノート別名グレースノートとも言う~みたいなざっくりした解説サイトもありましたが、ドラムスやベースやギターのゴーストノートと、クラシックで厳密に定義されているグレースノートが指している概念は、若干と言わずかなり違いましたね。
ただし、どちらもちゃんとビート/拍を念頭に置いていて、しっかり鳴らすメインの音があっての装飾、と言う点では共通しています。
ベロシティ≒ダイナミクスも大事です。
つまり楽器音も歌声も<音声>回で解説したことが基礎になってきます。

ゴーストノート調声

ゴーストノートの解説だけでかなり長引いてしまいました(汗)
やっと本題です。

実は、私が提案している「ゴーストノート調声」は概念としては「装飾音符調声」「グレースノート調声」のほうが近いです。
つまりゴーストノート調声を入れる箇所は主に、メインで聴かせたい発音の直前になります。後打音のように後ろに入れるパターンも一応あります。
ダイナミクス調整も伴うのでその点では聴こえるか聴こえないかのボリュームも大事になってくるゴーストノートの要素も含まれます。

ゴーストノート調声の注意点

先に注意点を書いておきます。
ゴーストノート調声はエモーショナルな表現をするための装飾テクニックのひとつに過ぎないです。劇的に変わるわけではありません。
NEUTRINOのようなAIシンガーはそもそも最初からある程度ナチュラルに歌ってくれますので、余計な装飾は「くどさ」「しつこさ」に繋がる可能性もあると頭の片隅に置いておいてください。
意図せず演歌っぽいコブシが入ったり、ねちっこい歌い方になることもあります。目的に合わせて意図的に使ってください。

また、「ゴーストノート調声」という名称に関しても、誇大解釈にお気を付けください。
解説してきた通り、ここ百年か数十年で定着してきたドラムスやベースやギターのゴーストノートの定義と、数百数千年の歴史の中で研鑽されてきた音楽全般で言うところ装飾音符やグレースノートの定義にはニュアンスの違いがあります。
「装飾音符調声」「グレースノート調声」のほうが類似概念としてはより妥当なんでしょうが、装飾音符/グレースノート自体がDTM界ではあまり注目されない用語ですし、「聴こえるか聴こえないか」という意味では似た概念でDTMerに馴染みのある「ゴーストノート調声」のほうが分かりやすいしキャッチ―だな、と勝手に私が名付けた仮称ですので悪しからず。
歌唱全般やDTM界ボカロ界における専門用語でもなんでもないです。

改めて言いますが、<音声>回や前回の歌詞入力の基礎を理解した上でないと、調声自体上手くなりません。
この調声法だけで「誰でも・簡単」に調声がレベルアップするといったものではないのでご注意ください。

ゴーストノート調声の利点

短所ばかり言っていては面白くないですね。
ゴーストノート調声の長所を紹介しておきましょう。

ひとつはもちろん、よりナチュラルでエモーショナルな表現ができる点です。「はじめに」で書いたように現実の歌手にすら有効なくらい。
特にNEUTRINOをはじめAIシンガーは元々ある程度人間らしく歌ってくれるので、あとひと癖の“らしさ”や“くささ”を求めるなら、さらなるクオリティーアップが望めます。

もうひとつは歌声ソフトのある意味弱点でもある、「膨大な学習データを元に人間の歌い方を統合・抽出・再合成した結果、結局インパクトの乏しい普通の歌声になってしまう」というときにゴーストノート調声でカバーできる場合があるという点です。
私がゴーストノート調声を使う理由はこちらが多い。
特にNEUTRINOだと、めろうさんのような癖の少ないシンガーに有効です。
一点目が長所を伸ばすため、もう一点が短所をカバーするため、といった使い分けです。

楽器演奏にしろ歌声にしろ、現実の人間の作り出す音にはアナログなブレがあります。それが人間らしさやその人の個性に繋がります。
対してAIが作り出す音はキレイだけれども整い過ぎていることがある。
飛び火させるのもなんですが、最近話題のAIイラストみたいな。確かにキレイなんだけれども味気無い量産絵になってしまう。

例えばある曲の歌い出しで
Aメロは「♪会いたくて〜
サビは「♪愛してる〜
みたいな歌詞だったとします。
この例の場合に、もしAメロとサビが同じ音程で始まるなら「(無音)→♪あい……」の同じ発音の流れですので、歌声ソフトやシンガーによってはどちらもまったく同時の発音タイミング、同パターンのピッチ変化、同量のダイナミクス変化で最初の「あ」[a]を発声することもあり得ます。
現実の歌手ではあり得ない、再現性が高すぎる機械ゆえの弱点です。
(ちなみにNEUTRINOだと前後の発声の影響で完全に同じにはならないように合成されます。さすが。)

歌声ソフトやシンガーによって多少のランダマイズ機能があったり得意音域のダイナミクスが強かったりという癖や特徴はありますが、サビの歌い出しが狙い通りの得意音域とも限りません。
曲の展開の都合上、不得意な低音から駆け上がるようなサビだったりすると逆に歌い出しが弱くインパクトが薄くなってしまうことも。
現実の歌手であればAメロは感情を押さえて語りかけるように、そしてサビはエモーショナルにパワフルに歌うといった使い分けをします。普通はサビが曲の顔ですから。
もちろんタイミング、ピッチ、ダイナミクス調整でも再現可能です。ただ下手に人力でいじって余計不自然になることもある。
それをもっと手っ取り早くしかもナチュラルに再現する方法がある、それがゴーストノート調声です。

サビで力強く「♪愛してる〜」と発声するとき、現実の歌手は一旦大きく息を吸い込んで一瞬のタメを作ったあと、その反動で勢い良く息を吐き出している。
息の吸い込みに関しては<発音>回の後半「ブレス」の項目で扱います。
今回のポイントは「一瞬のタメ」のほうです。
このタメの瞬間に何が起こっているかを理解できればゴーストノート調声の本質を掴んだも同然です。

ゴーストノート調声の具体例

実際に具体例を挙げていきます。
その例として最もわかりやすいのが、前回記事の最後の項目「ん」の応用です。

3つの「ん」

前回、日本語の「ん」(撥音)の発音は分類の仕方によって3〜6種類あると紹介しました。方言や個人差、話すスピードなどの影響もありますので一概に何種類と区分できるものではありません。
今回はこの「ん」を大きく3つに分類します。

1つめが「む」の発音をするときのような直前に唇を閉じるパターンの「ん」、
2つめが「ぬ」の発音をするときのような唇は開いたまま舌の位置で調節するパターンの「ん」、
そして3つめが「ん」と発音して!と言われた時に日本人が発音する喉奥で「ん」と発音するパターン。
それぞれ発音記号では[m][n][N]と別モノです。
([N]は正確には[ɴ]と小さく表記されます。)

ちなみに多くの外国語には3つ目の[N]の発音を含む言葉が存在しません。日本語など一部の言語だけです。(と、言われています。研究途上らしいです。発音できないわけではなく、単語中や文章中に含まれていないようです。)
[m][n]とその派生系の「ん」は各言語にありますが、[N]だけは日本語特有で特に語尾で発音されることが多い。
「本」や「装飾音」や「日産」の「ん」なんかです。
前回紹介したお話で、日本語学習途上の外国の方が「100円」と言うときに「ひゃくえん」の語尾の「ん」[N]がうまく発音できなくて[n]の発音で代用した「ヒャクエ(ンヌ)」のようなカタコトになることもあるといったのはこのせいです。
日本人でも「本とノート」と言うときの語尾に来ない「ん」は場合は次の「と」の発音に引っ張られて2つめの[n]に近くなります。「…とノート」を言わずに「本……」で止めると「ほ(んぬ)」っと言いそうになります。実際に発音して舌の位置が前歯の裏の歯茎あたりに当たっているのが確認してみてください。
「本とノート」を逆にした「ノートと本」だと「ん」を喉奥で息を止めているのが分かります。

(これもまたしつこいくらい注意しておきますが、言語に貴賤はありません。[N]の発音がある日本語が特別優れているなどというわけではないです。
英語発音の代表格である「th」の発音なんかはそれこそ英語特有で、日本人だけでなく他の欧米圏の人も練習しないと聞き取りも発音もできません。

英語と同じゲルマン語派のドイツ語だと「Thank you」(サンキュー、ありがとう)は「Danke」(ダンケ)で、綴りは似ているけど「th」の発音は存在しません。
ロマンス語派のフランス語だと全然違う「merci」(メルシー)でありがとう。単語の綴りとして「th」はあるけれど基本「t」の発音。
スペイン語には「th」の発音がありますが、「That's all right」(ザッツオーライ、大丈夫!)なんかの濁った「th」は無くて、濁らない「th」も「s」の発音に近くなっちゃうんだとか。

英語の「theater」(シアター、劇場)は、
ドイツ語で「Theater」(テアータ)、フランス語で「théâtre」(テアトル)、スペイン語で「teatro」(テアートロ)。フランス語は語尾の子音が消えやすいので「テアト」にも聴こえますが、英語以外みんな「テ」です。
ってか元々フランス語の「テアトル」が輸出された単語。
なぜ英語は面倒な発音に変化させたし?(笑)
ドイツ人だろうがフランス人だろうがスペイン人だろうが日本人だろうが、「Thank you, That’s all right.」の音だけ真似したらみんな「サンキューザッツオーライ」。
だってそう聴こえるんだもん。ありがとう、大丈夫!
その発音が特別だからといってその言語が優れているとか、発音できないから劣っているなどという考えはやめてといてください。
調声においてもその発音に聴こえるようにできればOKだと私は思います。
……つい余談が長くなってしまった。)

さて、
「ん」を使ったゴーストノート調声では、このうち3番目の[N]が最も効果的で使いやすいです。
むしろこれを意図的に使えるようになれば他はすべて応用です。

ゴースト「ん」の実例

[N]のゴーストノート調声がやりやすい理由を先に説明しておくと、単純に「ん」とノートに当てはめればそのまま「ん」と発音してくれるからです。
ダサいネーミングですが、
ゴースト「ん」
と呼んでおきます。

他2つの「ん」は「む」「ぬ」の発音から派生させることはできますが、母音[u]も発音してしまう以上単体の[m][n]を取り出せません。その場合[u]つまり「う」を使う場合と大差なくなります。

実例用に即席ワンフレーズを作ってみました。
先の例の、Aメロ♪会いたくて」、サビ♪愛してる」で、歌い始めが同じ音程・同じリズムの曲という想定です。

「♪会いたくて 歌に込めた~……」
後半は低音に下がっていってAメロっぽい感じに作曲。
「♪愛してる 歌に乗せて~……」
後半から高音になってサビっぽい感じに作曲。

分かりやすいように歌い出しは「ドレミファソー」の8分音符×4+付点2分音符のメロディーで共通させています。
なので「♪会いたくて」「♪愛してる」の部分のメロディーは全く同じ。
途中から「♪歌に込めた~ラララ~」「♪歌に乗せて~ラララ~」とそれぞれAメロっぽくサビっぽくなるよう音程に変化を加えています。
ちなみに音符を見比べていただくと分かると思いますが、リズムは上下とも完全に同じです。本当に音程のみの変化です。
(いずれ【作曲編】を完全基礎から書き直してみよう考えていますが、作曲できるってこういうことだと思っています。コード進行うんぬんより、まずはリズムが基礎。)

さて、それぞれを調整ツールで音声合成して波形を見てみましょう。
歌声はNEUTRINOめろう。
キーやフォルマント等の設定はいじっていません。
下調声ツール画面は「♪会いたくて」「♪愛してる」の部分までです。

Aメロ「♪会いたくて~」の部分。
サビ「♪愛してる~」の部分。

見比べてみると、同じ「(無音)→♪あい……」でも後ろに続く発声の影響で微妙に波形が違いますね。NEUTRINOの性能の良さがうかがえます。
共通しているのは「あ」のピッチが+1~1.5音程ほど上から入っている点と、「い」のほうが「あ」より少しだけダイナミクスが大きい点です。要は歌い出しの「あ」が弱い
上2つを聞き比べてみます。

いかにもありそうなバラード曲風。めろうさんの声が雰囲気に合っています。
ただ、どっちがAメロでどっちがサビかと言われると、歌い出しだけでは判別しにくい。後半のメロディーの盛り上がりでそれっぽいかな~?という程度。
調整ツール上のダイナミクス波形で見た通りあまり差がありません。
できればサビの歌い出しはインパクトを与えたいので、Aメロより強く発声して欲しいところです。
でも相手は機械でありデータ。何の指示も無しでは勝手にAメロやサビといった判断をして自動で強く歌ってくれたりはしません。
もちろんここから直接ダイナミクス等を調整して強く歌わせることもできますが、ピッチ変化も込みで何がナチュラルかを把握できていないと不自然になる可能性もあります。
そこで「ゴーストノート調声」の出番です。
AIシンガーが自動で合成してくれるナチュラルさを土台に、不自然な波形にならないように強く歌わせられないか探ります。

まずはサビの楽譜に手を加えます。

「ん」を追加して「♪ん愛してる~」に。

サビの「♪愛してる~」の直前に8分音符で低めの「ん」を追加してみます。
/あ/い/し/て/る」と歌わせてみる。
これで音声合成してみるとどうなるでしょうか。
下が合成結果です。

「♪ん愛してる~」で合成。

比較画像も並べておきます。

左が元楽譜、右が8分音符の低い「ん」を入れて合成したもの。
黒の横線が元の「あ」のアタック時のボリューム=最大ダイナミクス

並べて見ると、ピッチ変化もダイナミクス変化も違うものになっています。
右の8分音符の低い「ん」を入れたほうは、ピッチは低音から盛り上がってくるように、そしてダイナミクスは「あ」が大きくなって「い」が小さくなった結果、アタックボリュームがほぼ同じくらいまでになっています。黒矢印で示したところです。
細かいところでは「ん」を入れた方は、「あ」の減衰が遅めでサスティンがやや長くなり、「い」のアタックタイミングが早くなっています。水色の矢印でなぞってあります。

この状態で「ん」のダイナミクスを無音近くまで削ります。ベロシティ調整みたいなものです。

作業しやすいように横方向に拡大中。
「ん」をほぼ無音に下げて「あ」になめらかに繋ぐ。

「ん」のダイナミクスを無音近くまで下げて、「あ」の発音に影響が出ない程度にアタックタイミングになめらかに繋ぎます。
前回の「母音の無声化」の逆エンベロープです。
これでゴースト「ん」の完成。
この状態で元サビとゴースト「ん」を入れたサビを聞き比べてみましょう。

前半は①元のサビ途中まで→続いて②ゴースト「ん」で調声したサビ途中まで、
後半は短く③「♪愛してる~」→④「♪愛してる」→元の⑤「♪愛してる」の部分だけを繰り返して聞き直してみます。

「ん」を入れて調声したほうは、「⤴あ!いしてる~」といった感じでごくわずかですが「あい」に感情がこもったようになっています。ピッチ変化と合わせ低音から盛り上がってくる感じ。
聞き比べてみると元のほうは「→あいしてる~」といった感じのパンチの弱いやや平坦な歌い出しです。

この「ん」を入れて合成された歌声を土台にして、全体的にダイナミクスを上げる、またはアタック箇所のダイナミクスを強調してやると、ナチュラルなピッチ・ダイナミクス変化のままエモーショナルな歌声に調声できます。

アタック部をピークにダイナミクスを思いっきり引き上げてみる。
他は軽く上げる程度。

各発音のアタックをピークにダイナミクス波形を強調してみました。
最初の手を加えていないAメロと、ダイナミクスを強調したサビを連続で聞いてみます。
前半は①元のAメロ→②ダイナミクス強調サビ
後半は③「会いたくて」→④「愛してる」部分だけを抜き出しています。

単純なダイナミクス差もありますが、だいぶサビのほうがメリハリある歌い出しになりましたね。不自然な強調ではなくあくまでナチュラルに、かつサビっぽくより感情を込めた歌い方に調声することができました。

ゴースト「ん」の仕組み

なぜ発声直前に「ん」を入れるとピッチやダイナミクス変化が変わってくるのか、発音の仕組みの面から見てみます。

現実の人間が大きく歌おうとした時は必ず一旦息を吸い込まなくてはいけません。ブレスです。肺の中に空気が無い状態では大きな声は出せません。
そして吸い込んだ息を吐き出すのは逆方向の空気の流れです。
逆になる瞬間は無音、つまり一瞬のタメが生じます。
どこでタメているかというと、次の発音に準拠した唇や舌や喉といった部位です。つまり各子音の口腔内の形のままで息を止めているということです。
「あいうえお」といった母音単体の発音の場合、子音がありませんのでそのタメは子音を作り出す唇や舌ではなく喉奥で起こります。
空気の流れが止まっている以上、音としては出てきませんが、あたかも「」[N]と発音している時のような口の形になっています。

試しに息を吸い込んでから、喉奥ではなくを閉じてから「あ」と発声してみてください。いくら「あ」と言おうとしても「」っぽくなってしまうかと思います。無理に言おうとすると「ぶぁ」みたいな変な発声になります。
また同様に、息を吸い込んでからを前歯の裏の歯茎にべったりくっ付けて「あ」を発声してみると、「」っぽくなります。あるいは舌を素早く離そうとすれば「」っぽくなると思います。

AIシンガーは人間の発声データを学習して、ある発音から次に来る発音への流れごと再現してくれますので、単音では同じ発音でも前後の発声によって自動的にナチュラルなピッチやダイナミクスを生成してくれます。
初音ミクなどボーカロイド系は単音を抽出して音素(音の元になる材料レベル)まで分解したものを組み合わせていますので、前後の発音の影響はそこまでありませんでした。(素片接続法という仕組みだそうです。)
ボーカロイド系がどうにも機械的に聴こえてしまうのはそもそものこういった仕組みの違いがあるからです。しかし最近はAIの利点も活かして、ボーカロイド系でもより人間らしく歌うことができるようになってきています。

現実の人間が話したり歌ったりするときは、分解された音素を繋ぎ合わせているのではなく、同じ発音であっても前後の発音の流れによって口腔内の形状を素早く変化させています。
前回の「とんかつ専門店よ」の例文のように4つの「ん」をコンマ数秒のうちに無意識に使い分けています。使い分けるというか、勝手にそうなってしまう、というほうが正確でしょうか。口腔内の形状変化はアナログですから。
AIシンガーはその変化込みの音の流れを学習していますので、よりナチュラルに聴こえるというわけ。
ということはノートに合わせて単音を歌わせるだけでなく、ポイントポイントで前後の発音の影響をわざと与えてやれば良い。
特に歌い出しであれば歌詞上は無音であっても、現実には直前のタメがあるはず。タメの無い「あ」であれば弱く、タメたあとに発声する「あ」であれば強く発声するのが自然です。
そしてそのタメに一番近い口腔内の形が「ん」[N]というわけです。
ただし音は出ていませんのでダイナミクスは削ってやります。

これが「ゴーストノート調声」の仕組みです。あとは応用。
各発音の前後に実際に口腔内の形がどのようになっているかを実際にご自身で歌ってみるなりして意識すれば適切な発音が見つかります。
他に使いやすい発音としては「」や「」です。子音単体は取り出せないので基本は「あいうえお」の母音+撥音「ん」になります。
注意点としてダイナミクスをなめらかに削らないと、メインの発音が「あ」の場合なら「ヌあ⤴」「ゥわ⤴」「ォわ⤴」といった感じでねちっこい歌い方になることもあるので、そこは上手く微調整してください。
あくまで聞かせたいメインの音をナチュラルに合成するための装飾音符のようなものです。

ゴースト「ん」の使い方

ここからはどうやってゴースト「ん」を使っていくかという話です。

ゴーストノート/グレースノートについて前半で解説しましたが、共通点がありましたね。
ビート/拍です。
人間は歌う時に、あるタイミング息を吸い込んで、あるタイミングでタメて、実際に発声したいタイミングでメインの発音を開始します。
これは装飾音符とメインの音符の関係に似ています。
(細かく見ると、メインの発音は<音声>回で見た子音の開始タイミングの差がありますので、「さ行」はかなり早く「ら行」はギリギリまで待ってから本当のメインである母音がメロディーとほぼジャストタイミングになるように発音しています。)
それぞれのタイミングはどこでも良いわけではなく、曲のビート/拍に乗ったタイミングがベストです。
もちろん現実の人間にはアナログなブレやズレがありますので、気持ちが前のめりになってビート/拍よりハシったり、逆にタメが長引いたりすることもありますが、基本はビート/拍に乗ったタイミングでタメてから発声します。
ですので、ゴースト「ん」を入れるタイミングは
もし「♪ん」と直前に歌っても不自然にならない箇所
です。
実例の歌詞では歌い出しが8分音符×4でしたので、それにあわせて8分音符にしています。裏拍でタメて勢いよく歌い出す想定です。

再掲。

そして音程も、もし「♪ん」も歌うとしたら不自然にならない高さを選びます。
実例は「あ」の音程が「」でしたので盛り上がりを演出するために、5度のオクターブ下、低い「」を選びました。
コード理論やスケールもからんでくるので詳細は割愛しますが、Cメジャーキーの曲で「」と「」の関係は安定感があります。
他にオススメで一番安定するのは同音程(=1度)の「」。もっともナチュラルな変化で合成してくれますが、ピッチ変化が無いので今回のような盛り上がりの演出にはパワー不足かもしれません。
あとはそれを挟んだ上3度の「」や元の上5度の「」あたりが無難です。
「ド・ミ・ソ」の時点で勘付かれると思いますがCメジャー曲ならCメジャーコードの構成音がもっとも違和感なく繋げられるかと思います。
メロディーの流れによっては2度「レ」や7度のオクターブ下「シ」あたりも選択肢としてはありますが、変化量が乏しいのでピッチに対する効果は薄め。ダイナミクスに対しての効果はあります。
その音に対しての度数ではなく、基本は曲のスケールに則った音程です。あくまで「♪ん」も歌ったとしても不自然にならない音程。
またメインの音程と極端に差のある音程、例えば同音階でも2オクターブ下や2オクターブ上だと得意音域外になって効果が現れない場合もあります。
合成できなくてエラーになる場合も。
AIシンガーは現実の歌声データを元に合成しているわけで、あまりに極端な差があるものはうまくいかない可能性があります。

それと今回、下の「ソ」を選んだのは下側の音程で短い音価のほうがダイナミクスを強化する効果が出やすいからです。
なぜなら現実の歌唱でもそうですが、高く長い発音ほどその音を出すためにエネルギーを持っていかれてしまうので、本来メインで出したい発音の余力が足りなくなります。AIシンガーはそのあたりもある程度忠実に再現してくれるようです。
試しにオクターブ下ではなく、そのまま上5度」で長めの2分音符に乗せたゴースト「ん」入りサビを合成してみました。

「あ」(ド)の上5度(ソ)2分音符でゴースト「ん」を入れてみる。
「♪ん~愛してる~」とサビ前にハミングするようなイメージ。
左側が上5度「ソ」2分音符、
右側が実例の5度「ソ」オクターブ下で8分音符。

画像が小さくてちょっとわかりづらいですが、ピッチ変化はもちろんのこと、ダイナミクス変化も違います。左側の上5度2分音符のほうは、今回採用した右側の実例に比べ「あ」も「い」もアタックがわずかに落ちて減衰が早くサスティンが弱くなっています。また「あ」のスタート時のボリュームも小さいです。
この順番でわざと「ん」のダイナミクスを残したまま聞いてみます。「♪ん」も歌詞として歌わせてみるということです。以降のダイナミクスも手を加えず未調声のままです。

誤差程度なのでパッと聞いただけではわかりにくいですが、前半の上5度2分音符はちょっとパンチの弱い歌い出しです。ハミング込みで優しく歌い始めるような目的の場合はこちらでも有りです。ただ捉え方によってはだらしない感じにも聴こえる。

曲の展開に応じて1番サビは手を加えず合成したそのまま、2番サビはハミング込みで優しく、ラストサビは下音程の短いゴースト「ん」を使ってパワフルに、といったふうに使い分けるのも良いかと思います。

それからゴースト「ん」の使いどころとしては歌い出し直前のパターンが多いですが、発声終わりに使う手もあります。ブレスに関わってきます。
今回飛ばした「ブレス」については<発音>回の最後で解説する予定です。
その際にゴーストノート調声が再登場します。
少し先に触れておくと、「休符」の代わりにゴーストノート調声を使うテクニックです。
休符はもちろん歌詞ではないですが、現実に歌う時にずっと口を広げっぱなしということはありません。歌詞の区切り区切りで口を閉じることもあります。
特にロングトーン後。長音の最後ギリギリまで息を吐き出し続けるのではなく、どこかで口を閉じるなりしてスパッと止めた方がメリハリある歌声になります。
試しに今回の実例のサビの手前に「♪ラララ~」と伸ばすBメロの歌い終わりパートを追加してみました。サビ前にロングトーンになるのはバラードに限らずありがちなフレーズです。

Bメロ歌い終わり想定で「♪ラララ~」のあとに休符。
同じ想定で「♪ラララ~」+同音程の「ん」。

それぞれの合成結果を波形で見てみます。

休符の場合。
ゴースト「ん」を入れてダイナミクス調整した場合。

休符の場合、やや高音域での歌い終わりということで、ピッチの最後が揺れながら急に上がっています。いわゆるシャクリです。ただ、ダイナミクスも4分音符分くらい手前から減衰していますので音としては弱くほぼ聴こえません。
一方ゴースト「ん」を入れた場合、「ん」の発音をするためにダイナミクスが維持されて、長音「ら」の最後まで落ちることがありません。これも急に削ると不自然になるので、なめらかなエンベロープを描いて調声しました。
聞き比べてみましょう。
①ラララ+休符からサビ頭まで→②ラララ+ゴースト「ん」からサビ頭まで→③ラララ+休符→④ラララ+ゴースト「ん」で繰り返します。

①③の休符の場合は自然と消え入る感じ、
②④のゴースト「ん」の場合はバチッと止める感じになります。サビに繋がるタメ感が出ますね。
もちろん「ん」のダイナミクスを完全に残せば「♪ラララーン」になります。

この後ろ入れる「ん」と手前に入れる「ん」を併用すれば、よりタメを強調したパワフルでエモーショナルな表現ができるかと思います。

実際に作業する際は、Aメロパート、Bメロパート、サビパートといった感じでそれぞれ別に制作して、DAW上で繋ぐことになります。長すぎるとバグりやすいですし、修正するたびすべてを作り直す羽目になってしまいます。
各パートにまたがっている発声があったり、Bメロ→サビ間に休符が無いメロディーだったりするときは、他の区切りの良い箇所ごとに制作してから繋いでください。
たとえ休符があっても短いものだと、ちゃんと前後の発声の影響がでます。促音「っ」の代わりに休符を入れるたびに、音声合成パターンがリセットされるわけではありません。ある程度の長さに渡って前後の発声の影響がでます。
聴こえはしませんが、ゴーストノートと同じく促音や休符も歌声の一部と考えれば良いかと。つまり日本語の1モーラです。

最終的にBメロ→サビを繋ぎ合わせた出来上がりを聞き比べてみます。
前半が元のBメロ→サビを繋いだだけのもの、
後半がそれぞれにお尻と頭にゴースト「ん」を入れた上でダイナミクスを強調して繋げたものです。

そのまま合成しただけでは単調になりがちなめろうさんの歌声ですが、前半と後半でエモさやパワフルさに違いがありますね。
こんな風に、現実の歌手ならこういう風に発声するだろうというのを踏まえた上で調声していくと、より表現力が増していくと思います。

ゴーストノート調声はあくまでそのための補助的なテクニックです。
ただ闇雲にピッチやダイナミクスをいじっていくより、ナチュラルな音声合成自体はAIシンガーが得意とするところに任せ、それを土台に削ったり強調したりと手を加えていくほうが良いのではないかと私は考えています。
初回に提案した通り、調声はお手伝いですから。

現実の歌手はどのように活かしているか

はじめに、で紹介しましたが、現実の歌手でもゴーストノートに相当する発声を自然とやっています。
以前も参考にさせていただいた宇多田ヒカルさんの『First Love』を、また参考に出します。

私が聞いたうちで歌詞とは違う小さな音が入っていたり、聴こえないけれど「ん」に相当するタメで息を止めているなと感じた主な箇所は以下。

1番Aメロ
「♪最後キスは」の「の」の前に「ん」(0:24あたり)
「♪苦くて切い」の「な」の前に「ん」(0:35あたり)
1番Bメロ
「♪したの」の「あ」の前にタメ(0:43あたり)
「♪あなたはどこ るんだろう」の「に」と「い」の間にタメ(0:51あたり)
「♪思ってる ろう」の「ん」の後(あるいは「だ」の前)に「ぬ」(0:58あたり)
1番サビ
「♪いは」の「ま」の前に「ん」(1:25あたり)
「♪歌えるまで」の「ま」の前に(あるいは「る」の後)に「ん」(1:36あたり)

2番Aメロ
「♪立ち止る」の「ま」の前に「ん」(1:55あたり)
「♪動き出そう」の後に「ん」(2:00あたり)
2番Bメロ
「♪泣いてい なたを」の「る」の後に母音と別の「う」(2:24あたり)
2番サビ
「♪いつも あなただけ」の「も」の前(あるいは「つ」の後)に「ん」(2:40あたり)
「♪歌えるまで」の「る」の母音「う」に「ま」の子音が食われて「わ」っぽい発音に変化(3:07あたり)。子音がゴーストノートのように弱くなっている珍しいパターン。1番の同じ箇所と比べるとまったく別の発音です。

他にもありそうですし、今回はブレスを扱っていないのでタメなのか休符なのかブレスなのか分かりにくい箇所もあります。
また1番Aメロの「な行」の発音などは「ん」と発音しているのか「な行」の子音[n]が早めにスタートしているのか区分できないところもあります。現実はアナログなので。
歌声ソフトで再現するなら、「ん」を入れるのではなく[n]のタイミングを早めるのも手段です。「最後ヌォ」や「切ヌァい」とねちっこくならない程度での調声が必要になってくると思います。
それと、やはり全体的に「ま行」「な行」「あ行」の直前であることが多い。最初に挙げた3つの「ん」、[m][n][N]から繋がってますね。

ついでにサビの「♪You are always gonna be the one」の「one」はちゃんと英語発音の「ワ(ンヌ)」といった感じで日本語の「ん」と使い分けています。
対して「♪ラブソング」の「」はカタカナ英語っぽく母音[u]までしっかりめに発音。「ラ/ブ/ソ/ン/グ」5モーラとして1つずつ当てはめてあります。英語本来の発音なら「Love/song」の2音節です。

さらについでに「the one」は「・ワン」ではなく「・ワン」で発音しています。
中学英語で母音の前の「the」は「ジ」になると習ったかもしれませんが、綴り上は「one」でも発音上は「ワン」つまり[w]とも考えられるのが一点、
もう一点は「あなたただ一人」という意味を強調するために「ザ」をあえて使っているのではないかと思われます。MVのそのシーンで人差し指を立てて強調していることから、私的には後者の解釈を押したいところ。
アメリカ生まれの宇多田ヒカルさんらしい、彼女なりの表現だと思います。

さて、こんな感じで表現力の高い現実の歌手は意識的か無意識的かわかりませんがゴーストノート調声っぽいことをやっていて、それがエモーショナルな表現に一役買っているわけです。
しかし、あまりやり過ぎるとねちっこくも聞こえます。
「なにぬねの」が「ぬぁ、ぬぃ、ぬぅ、ぬぇ、ぬぉ」みたいに聴こえる。
こればかりは好みなので良し悪しはありません。
いわゆるヴィジュアル系バンドに多い傾向があるようです。
それから演歌系歌手はかなり意図的に入れています。ねちっこさをむしろ活かしている。
恐らくコブシを強く発声するためにはしっかりしたタメが必要だからだと思います。

都はるみさん『好きになった人』
歌詞のメロディー上は「♪さよーならーさよなーらー」なんですが、
「んさんよーぅんなるぁんさよんなーらー(ブレス)」といった感じ。
短く音を切りながら次の発音のタメを随所に入れています。かなりパワフル。
若い方はあまり知らないと思いますが、ミリオンセラーをいくつもヒットされているのはこの歌唱力あってです。最近は活動休止されてるようですね。

反対にあまり多用せずにピンポイントで使っている方だとこちらとか。

Official髭男dism『Pretender』
それっぽい箇所は主にBメロ。
「♪もっと違う設定で」の他、いくつかの「もっと」の「も」の前にタメ、
「♪愛を伝えられたらいいな」の「あ」の前に「う」が入っているくらいでしょうか。
他のパートはメロディーの乱降下によって印象付けている分、Bメロは短いフレーズの繰り返しで歯切れ良くもエモく聴こえるようにして対比させています。Aメロは細かなブレスの使い分けも効いていますね。
もともと印象の強いAメロやサビのあちこちにまで入れてしまうと、曲全体としてしつこくなってしまうかもしれません。

ゴーストノート調声の関連テクニック

前回最後に自作曲『さよならアドレセンス』を例に撥音」について解説しました。
その際に「ゴーストノート調声」に少し関わってくる、と書きました。
前回曲そのもののリンクは張らなかったので、今回は載せておきます。

あらかたは文章で解説しましたが、音と画像付きでゴーストノート調声との関連について解説しておきます。

この曲、すべての箇所ではありませんが「アドレセンス」の「ンス」は「ぬす」と入力して音声合成後に、タイミング調整等で自然に消え入りつつ伸ばす「ns……」に調声しています。
何度も登場するフレーズですがコピペではなく、曲中で表現したい感情変化やリズムに応じてそれぞれ別々に調声を掛けています。
特に曲の頭サビの「♪アドレセーンス」と短く切る箇所と、ラストサビ最後の最後(4:30~)で長く伸ばす「♪アドレセーーーンスゥ……」がまったく違うのは聴いていただければわかるかと。
その部分だけの比較音声です↓

前者は「せんす」で入力合成後「」の母音[u]のダイナミクスを削っただけ
後者は「せぬす」と入力合成後、「」の母音[u]のタイミングを「す」のギリギリまで寄せ、「」の母音[u]を音価めいっぱいまで遅らせています。
それぞれ画像はこんな感じ。↓

頭サビの楽譜
合成して「す」のダイナミクスを削っただけ。

」も付点16分音符167.91ms程度)と短めですし、「」に至っては128分音符13.99ms程度)と一つの発音として聴き分けられるかどうかの短さです。(時間はBPM=134から逆算。ms=ミリセカンドは1000分の1秒。)
実際にこの楽譜で合成してみると「す」の子音[s]の発音が「んす」のど真ん中あたりのタイミングでスタートするので、「ん」の半分と母音[u]のほとんどを食ってしまっています。
なのでダイナミクス削りだけで対応可能でした。

一方、ラストサビの最後の最後。

ラストサビ最後の楽譜
ごちゃ~っ!

調声ツール画像にアレコレ書き込んでますが、ざっくりな理解で構いません。とりあえず「」も「」も母音[u]が発音されないくらいまで遅らせてるということが分かれば。

」から母音[u]が無くなることで舌で息を止める[n]の「」を再現できる。それをダイナミクス調整でボリュームを落とすという点から見ると、これも一種のゴーストノート調声です。ゴースト[n]
」も同じく母音[u]が無くなって、ごく弱い[s]だけが長く残るようにしています。子音母音のタイム・デュレーション調整でもあり、見方によってはゴースト[s]とも言えます。ただし元のピッチ(茶色線)が激しく不安定なブレ方をしているので、半分バグに近いような裏技です。
ここまで来ると前回紹介したアポストロフィ機能程度では再現できません。なので私はあまり使っていない。
むしろ表面的なテクニックや便利機能を使うより、今まで解説してきた<音声>や<発音>の基礎を理解して、このくらい意識的に手を加えることができるようになれば自然と消え入る「ns……」を再現できます。

ちなみに最後を「ぬす」ではなく「んす」のままで、調声もまったく掛けていないとこんな感じ↓

「♪せーーーんー!すーー!」
コレハヒドイ。

結び&次回予告

はぁぁぁまた2万字超えてしまった。
毎度長々とお付き合いいただきありがとうございます。

今回の「ゴーストノート調声」は、テクニックという観点から見れば本来かなり後半で紹介すべき内容だと思います。
その名の通り幽霊のように音がほぼ消えてしまうので一見(一聞?)効果が分かりにくいですし、飾りと言ってもブレスほど目立つわけでもない。
ましてや歌モノ曲の2大主役である「メロディーフレーズ」と「歌詞」そのものに比べれば、いわば完全なる脇役、モブキャラ、黒子
どれほど苦心して調声しても誰にも気づかれないかもしれません。
しかし舞台劇や映画やアニメであっても、その主役を取り囲む取るに足らない人物たちこそが、主役たちのストーリーに彩りを与えます。
調声においても、そのほぼ聴こえない音たち、表舞台に出てこない音たちがより深みのある表現に繋がると思います。
直接聞こえる音を表面的にいじっていくのは簡単です。
でも実際に曲にリアリティを与えているのは、ゴーストノートやタメ、促音や休符などの聴こえるか聴こえないかの「)」にあると私は思っています。音楽は時的な流れをもつ表現方法のひとつですから。
1つ1つの音が点だとするなら、点と点の間が大事です。点と点を結んだ線がメロディーであり、その線と線が重なってハーモニーを作り、面と面が重なって音楽的空を作り、それが重なってリアリティのある体(たい)を成します。

ちょっと前に投稿したNEUTRINOセブンちゃんの曲があります。↓
あちこちから音が聴こえてくるような作品で、梅雨時期の静かな軒先をイメージしています。
コンセプトは「耳で読む絵本」。空間を音に落とし込んだような曲です。

32曲目『かえるのお姫さま』No.7/SEVEN/セブン
たぶん初めて彼女の歌声を聴く人であれば、こういう声でこういう歌い方なんだろうな、ゆっくりした曲をなぞるように歌うんだな、と思うかもしれません。
まさか!(笑)
NEUTRINOユーザーや私のセブンちゃんの作品をご視聴したことのある方ならご存知だと思いますが、本来かなり癖の強いアニメ声です。
公式サイトの説明文には以下のように書かれています。

No.7 / Seven

No.7(SEVEN)は研究者向け歌唱データベース(小岩井ことり歌唱データベース)を元に制作された歌声ライブラリです。声優「小岩井ことり」の声が元になっており、力強くメリハリのある歌声が特徴です。

推奨音域:mid2A~hiC(A3~C5)
得意なBPM: 100~180
得意なジャンル:ロック、ポップソングなど

NEUTRINO公式サイトより

小岩井ことりさんは声優として活躍する一方、作詞作曲もできるマルチな方です。セブンちゃんの学習用にご自身で50曲ほど作詞作曲されたとのこと。
アニメCVとしては『のんのんびより』の宮内れんげ役が有名なのかな?「にゃんぱすー」の人。(見てないので詳しくないです。)
声を聴いたら分かりますが、幼い女の子のアニメ声からなんとデスボイスまで出せるそうです。
そんな彼女の歌声を元にしたセブンちゃんに『かえるのお姫さま』は歌ってもらっています。元の声から考えるとかなり異色。
BPM=112なので一応得意BPM内ではあるものの遅め。
ジャンルはロックではないですし、ポップソングといってもバラードと童謡の間のような曲。
そして音声合成時の楽譜は以下。

Aメロ歌い出し。

楽譜を見ると全体的にやたら下~ぁのほうに棒が伸びています。
この歌い出しの「な」が曲中の最低音。音程は「G2」。
セブンちゃんの推奨音域はA3~C5とされています。
ということG2は推奨音域最低音のA3からなんと14音(オクターブのさらに-2半音)下です。
音声合成できるだけでも異様な感じですが、完成作品は特に不自然なところもなく、落ち着いて語るようなナチュラルな歌声になっているかと思います。歌声が自然、といったコメントもいただきました。
この曲は、完成作品つまり表舞台の歌声からは予想の付かないであろう調声をいくつか重ね掛けしてあります。
そのうちのいくつかはすでに解説してきた、タイミング・ピッチ・ダイナミクス調整です。
そして問題は推奨音域から大幅に外れたこの楽譜から、どうやって完成作品の歌声に調声していったか。
次回の話題はそのテクニックを支える「フォルマント」についてです。
<発音>のさらの裏舞台をのぞきに行ってみましょう。

それではまた次回。
Thank you for reading!


この記事が気に入ったらサポートをしてみませんか?