見出し画像

スマホで自動文字起こしをやってみてわかったこと

この記事は、Podcast「にゃおのリテラシーを考えるラジオ」の2021年12月21日に配信したものの書き起こしです。

にゃおのリテラシーを考えるラジオ

読書と編集の千葉直樹です。

このチャンネルでは、読書と IT 時代の読み書きそろばんを中心に様々な話をしています。

今回のタイトルはスマホで自動文字起こしをやってみてわかったこと、想像しているだけでは何も分かっていないという話です。

最近 Google のPixelというスマホのアプリで音声からの文字起こしをやってみました。

音声データから文字起こしをするサービスやアプリケーションは割と古くからあるのですが、どれもお値段が高い割には出力がイマイチというものばかりでした。

文字起こしの代表的な用途としては、会議の議事録作成がありますが、やってみると人が作る議事録とは似ても見つかないケースが多かったのです。

議事録を作るというのは、単純に音声を文字にするだけではなくて、背景や発言の文脈をきちんと理解して、ふさわしい用語を選んで文章にするという高度な知的作業なのです。

今の技術レベルはそれに遠く及びません。とりあえず認識した音声をとにかく文字にするという段階です。

実際には単純に音声を文字に変換するだけで、例えば読点や句読点を打ったり、改行したりということだけでも人が自分でやるというのが普通でした。

ということは、変換された文章らしきものは区切りなくダラダラと続く文字列だということで、とても読みにくく、読みやすく編集するだけでも一苦労だったのです。

でも、今回 Pixel の文字起こし機能を使ってみると読点句読点だけでなく、ある程度段落分けのようなことも出してくれます。可読性は段違いです。

まだ単語の変換ミスは割とありますが、ダラダラ書きを分かち書きにするのと比べれば修正していくのは全然楽です。

いずれは修正を学習して正確な変換ができるようになっていくでしょう。

今回やってみて感じたことは、やっぱりモノは実際に使ってみないとわからないということでした。

良いことばかりではありません。文字起こしを効果的に使うにはキーボードを打つために練習するのと同じか、それ以上の訓練が必要そうだということもわかりました。

カジュアルに話すことは文章を作ることとは全く違います。文章を書くためには文章らしく話す訓練が必要なのです。

文字起こしをしてみると、いかに相手に伝わらない話をしているかが白日のもとに晒されてしまいます。もっとわかりやすく、リズミカルに言いたいことを簡潔に話す練習が必要となるのでしょう。

僕はこのポッドキャストを一度変えた原稿を読む形で収録しています。

それでは本末転倒です。

話したことを文章にしても困らないように日々話す練習をしていこうと思います。

読書と編集では IT を特別なものではなく、常識的なリテラシーとして広める活動しています。詳しい内容については、概要欄のリンクからまたは読書と編集と検索して、猫がトップページに出てくるホームページをご覧ください。

ではまた。

Podcastの聴き方は以下のnoteをお読みください。


この記事が参加している募集

#やってみた

36,770件

この記事が気に入ったらサポートをしてみませんか?