コラム“韻発掘の正引きと逆引き”
概要
日本語話者の場合、日本語の語彙からライムフレーズを探すのは(多言語に比較して)高速であると考えられる。
音声認識
聞いた音を、言葉として理解するプロセスは次のようになる。
音声を聞き取り、音声データとして一時記憶する
そのデータに合致する言葉を知っている語彙から探す
複数マッチする可能性がある
文脈や状況を踏まえ、音声がどの言葉であるか特定する
言葉の意味や意図を把握する
ここで、“知っている語彙から探す”という作業は母語において最も効率化される。
音声認識と韻発掘は似ている
ある素材フレーズから音響一致を頼りにライムフレーズを探す時は、これと似た作業が行われる。
素材フレーズを発声し、音声データとして一時記憶する
そのデータに合致する言葉を知っている語彙から探す
複数マッチする可能性がある
文脈や状況を踏まえ、使用できる言葉を特定する
一連の文章として馴染ませる
ここでも、母語の語彙が主な発掘ソースとなるだろう。
韻発掘の正引きと逆引き
したがって発掘において作業効率化を考える場合、馴染みのない言葉を発掘の起点とし、そこから知っている言葉を探すのがよい。
仮に、これを発掘における正引きと定義する。
外国語から、響きの似た母語の言葉を探すのが正引きの代表例である。
たとえば日本語話者の場合、「マカレナ」から反射的に「巻かれな」を発掘しやすい。
逆に馴染みのない言葉や特殊な言葉を探す作業を逆引きとする。
こちらは言葉の存在に気付けないことも多く、辞書や検索によって“存在するかどうか”のチェックが必要となるので、発掘効率は悪い。
(文/SIX)
from 韻韻
変更履歴
2022.11.9 メールマガジン用に書き下ろし
2024.5.16 note用に改稿
この記事が気に入ったらサポートをしてみませんか?