見出し画像

マイクに向かってコンニチハ

音声認識でテキスト入力をする人を最近よく見るようになった。より正確には、音声入力しているところを見るよりも、音声でないと起きないような誤変換を見るようになったので多分そうだろうと思っている。

音声で議事録を取ってくれるというシステムもさいきん会社に導入された。テキストの方はまあまあ良いが、ギークっぽい用語が無理やり日本語になってしまうのと、あと私の名字がだいたい他の人になっている。このまえは内側(ウチガワ)さんになっていた。私をリアルに知っている人なら、キャラ的にウチガワはないだろうと言うと思う。

音声入力は早い。キーボードの入力にストレスを感じる人が音声を好むのはとてもよくわかるし、じっさい今の音声入力はとても良くなっていて、有り得ない誤変換は減ってきている。その分、それっぽいが間違っている文字になってしまうと発見が難しい。

ところで私は音声入力をほとんど使わない。

ついてこないのだ。書きたい文章に口がついてこない。

私をリアルに知っている人なら激しく否定するはずだ。あれほど口から先に生まれてきたほどよく喋るのに、音声入力が遅いなんて、ましてやできないなんてそんな馬鹿な。聞こえる。脳内の友人がそう言うのが聞こえる。

でも本当だ。こんな仕上がりの文章を書きたいと思って話し始めると、途中から脱線して違うものになってしまう。なんなら内容も変わってしまう。

どうやら、書いている時と話している時で使っているロジックが違うらしい。書き始めるときはざっくりと、こんな方向にまとめようと思って書き始め、段落単位くらいで書きまとめながら着地点に近づけていく。ところが話すときは頭の動きがとても直線的で、前後の2・3語しか頭に浮かんでいない。書くときのように面的に広がらないのだ。

どうも話すことをイメージするときに絵的な情報がカットインしてきているらしい。音が文字に起こされるのを想像している回路。この処理がいろいろなことを遅くしている、っぽい。もっと言えば、こういう言葉を使った方が変換が正確だろうか、とか、どこで句読点を打とうかとか、そういうことを考えるので処理が落ちている感じがする。人前で喋っているときは特にそんなことを感じないからだ。

わからない。もともと処理速度なんてそんなもので、音声入力によって見える化されるから気になるだけなのかも。一方で、楽器を弾く時にメトロノームが横で鳴っているとひどく間違えたことを思い出す。耳と目と両方からフィードバックが来るから混線する?

いや、ただの考え過ぎかも。なんかうまいこと書こう(言おう)とするからいけない。気軽にやればいいのかも。しかしこれは私に固有の現象なんだろうか。たいへん気になる。

……という、これはタイプで入力している。音声入力にしてみようかと思ったがやめた。どちらかといえば私は、なんとなくうまいことを書きたいし、なんとなくそれっぽくまとまったものを読んでスッとするのが好きだからだ。

この記事が気に入ったらサポートをしてみませんか?