見出し画像

【ちょいテク】画像の文字をテキスト化したい!そんな時にはOCR。WEB上では、Googleが提供しております。

今回は、「OCR」についてご紹介したいと思います。
で、最初に言ってしまいますが、GoogleはGoogleドライブとGoogleドキュメントを使用して、OCRサービスをWeb上で実現しています。


「OCR」ってなに?

OCR=Optical Character Recognition/Reader、光学的文字認識
なのだそうです。
簡単に言えば、「画像に描かれた文字をテキスト化してくれるツール」です。

例えば、1枚の資料を渡されて、
「これ、テキストで打ち直して」
という依頼があったりする場合、結構面倒な作業になりますよね。

そういう場合にはOCRソフトがあれば、資料をスキャナーで読み取り、そこからOCRソフトにかければ、自動的にテキスト化してくれます。
エプソンのプリンター&スキャナーを買うと、付属で「読んでココ」とかのOCRソフトがついてたりしますので、それを活用するのもいいですね。

では、OCRソフトがない場合はどうすれば…?

で、GoogleドライブのOCRって?

はい。GoogleではWeb上でOCRのサービスが提供されています。

まずは、Googleドライブの立ち上げ方から。
(必要ない?(^_^;))

画像1

図の①を押して、②を押せば、下図のようにGoogleドライブが開きます。

画像5

③そこに、エクスプローラから文字が描かれた画像データをドロップします。

画像3

④ドロップした画像ファイルを右クリックしてメニューを開き、
⑤「アプリで開く」→「Googleドキュメント」
を選択すると・・・

画像4

下図のように、元画像からテキスト化された状態でGoogleドキュメントが開かれます。

画像5

もちろん、そのままGoogleドキュメント内でテキスト編集できますし、テキストをコピペして、他のテキストエディタで文字編集するのもOKです。
(「内」が「內」になっていたりとかするので、ちょっと注意が必要ですが…(笑))

スマホでは、ちょっと前にでた「Google LENS」というアプリでOCR機能を持てているようで。
僕はまだ使ったことはありませんが…(^_^;)

GoogleのサービスでOCRが使えるって、もしかして検索にも影響が?

はい。Googleがデータベースにインデックスしている画像たちも、テキストを拾われているようです。
参考:https://www.itmedia.co.jp/news/articles/1908/26/news055.html
  (まずは英語から対応、という記事)

最近は日本語でも、alt や周囲のテキストになく画像にしか書かれていないキーワードでも、画像検索される事例が報告されております。

実は今回ご紹介したOCRサービスは、結構以前から使用できており、その技術が検索エンジンにも結びついてくるだろうなあ、とはボンヤリと予測しておりました。

まあ、Googleも早いとこそうしたかったんでしょうけれど。
2007年には特許申請が行われておりましたから。
参考:https://japan.cnet.com/article/20364366/

まとめ

というわけで、今回はGoogleのアプリでOCRのサービスが存在することをご紹介いたしました。
知っておくと、いざという時に便利ですよね、これ。

それに従って、検索の方にも影響が出ております。
記事作成の時に、頭の片隅に入れておいていただければ。
画像文字でも、認識しやすいデザインと認識しづらいデザインもあると思いますので、画像を作成する際にGoogleドキュメントで一旦テキストに変更してみて状態を見るとか、SEOを目的とした記事作成にも有用なんではないかと思います。

オマケ(百マス計算)。

自分の子供用に作ってみた、百マス計算です。
https://revenue-test.biz/test_html/Math-hundred.html
家族でやってみたところ、僕は嫁に負けまくってしまいました(^_^;)
うーん、僕の方が数学得意なはずなのに…(>_<;)
スタートを押してプリントアウトすると解答も一緒に印刷されるので、紙ベースでも使いやすいと思います。

よろしければお使いください。

この記事が気に入ったらサポートをしてみませんか?