見出し画像

スマホのカメラだけで、紙の本の文字をデータ化できるGoogleレンズのOCR機能が便利です

紙の本を読んでいて「これは」と思った文章を記録するのに、非常な便利なツールを発見したのでご紹介します。

Googleが開発した「Googleレンズ」というサービスです。紙の本に書かれた文字を読み取り、文字データに変換してくれるOCR(光学文字認識)機能を持っています。

以下の記事では、実際にどんなふうに文字を読み取れるのか、書いていきます。

実際に使ってみる

今回、文字を読み取ってみる本はこちら。翻訳家の方が、翻訳の難しさと面白さを語ったエッセイです。

画像1


読み取りたいページを開いて、Googleレンズのカメラを向け、「テキストをコピー」をタップします。

画像2


すると、こんな感じで読み取る文字が選択できます。

画像3

 選択したテキストは、スマホまたはPCにコピーすることが可能です。

このページから読み取ったテキストをペーストしてみると、こんな感じです。

アイをめぐる悩み
英語と日本語の一人称はかなり違う。なんといっても英語の場合、一人称は 「I」ひとつ。幼児でも若者でもおばあちゃんでもドラゴンでも異星人でも、みー んな「I」 なのだ。これは考えようによれば、 すごいことかもしれない。
じゃあ日本語ではドラゴンや異星人のための特別な一人称があるのかといわれると それはないが (たぶん)、とりあえず「ぼく、おれ、わたし、わたくし、あた し、あたい、自分、自ら、己れ、われ、わし、拙者、うぬ、朕:…」数え上げれば きりがない ことはないだろうが、 ずいぶんたくさんあるのは間違いない。 そし てそれぞれが独自のニュアンスを持っている。だから昔のおばあちゃんが自分のこ とを「おれ」といったりすると、もうそれだけでかなり強烈なインパクトがある しかし何度も繰り返すが、英語には「I」しかないのだ。だから、日本語につい てほとんど知らない欧米人に、「日本語には「I」にあたる一人称が日常的に十や 二十はあって、日本人は各自そのうちのいくつかを自分の立場とTPO(TPOは

時おり、不要な半角スペースが挿入されていたり、句読点が読み取れていなかったりしますが、ピンポイントでテキストを読み取るだけであれば、十分実用に耐える精度だと思います。

ただし、ページをまたぐ文章は読み取りにくかったり、カメラを向ける角度や照明の具合などによっては読み取りの精度が落ちることがあります。また、1ページあたりの読み取りにかかる作業時間が長いので、大量のページを読み取るのには向きません。

ちなみに漫画だとこんな感じです。吹き出しの中のセリフはだいたい読み取れますが、背景にまぎれた文字は取りこぼすことも。

画像4

文字を読み取りができると何がいいか?

紙の本の文字を読み取ってテキストデータ化できると、色々はかどります。

・紙の本から内容を引用したり、自分用の読書記録に書き写す手間がかなり減ります。

・読み取ったテキストデータを、特定の文字で検索することが可能になります。これが大きい。たとえば上記の文章だったら「一人称」とか「英語」とか入力して検索すればヒットします。ぼんやりとでも内容やキーワードを覚えていれば、検索で見つけ出せます。

以前にこちらの記事でも、読書メーターというWEBサービスに投稿した読書記録を、本文検索できるようにしたことがあります。自分自身の記憶をあまり信用していないので、読書の記録を特定のワードで検索できる状態にしておきたいです。

「電子書籍を買って、そのテキストをコピーすれば良いのでは?」とも考えたのですが、電子書籍のテキストは、著作権上の理由で、コピーできるテキストの文字数の上限が決まっていたり、そもそもコピー&ペーストが不可能だったりします。また、読みやすさの点に限って言えば、まだまだ紙の本の方が優れていると感じています。また、紙の本は出版されているけれど、まだ電子書籍化されていない書籍も多く存在します。

二度手間のようにも見えますが、紙の本の読みやすさを享受しつつ、検索できるテキストデータも得られるという点で、このGoogleレンズはなかなか有り難いツールだと感じます。

蛇足になりますが、欲を言えば、紙の本を買った人は、その本のテキストデータをダウンロードできるサービスがほしいです。ただ、仮にそんなサービスが成立したら、海賊版の本が出回るなどの問題が予想されますし、著作権上の理由からも、現実的ではないと思われます。

対応機種

以下のサイトを参照したところ、Googleレンズの機能が搭載された「Googleフォト」アプリは、すべてのAndroidおよびiPhoneに対応しているとのことです。


ちなみにGoogleレンズの公式ページはこちら。文字のOCR以外にも多様な機能があるようです。


まとめ

GoogleレンズのOCR機能を使って、紙の本の文章を読み取ってテキストデータ化する方法をご紹介しました。

知らないだけで、この手の便利なサービスは身近にあふれているんじゃないかと感じています。スマホアプリに限らず、自分の生活全般を少し良くするツールは、食わず嫌いせずに使っていきたいです。




この記事が参加している募集

最後までお読み頂きありがとうございました!