見出し画像

AI-OCRの手書き文字認識率を上げるには

アライズイノベーションの森です。
AI-OCRにかかわる仕事をしています。

「RPACommunity:RPAに関するよもやま話 Advent Calendar 2020」
Advent Calendar2020企画 18日目に参加です。

テレワークが一般的になってきた中、みなさまいかがお過ごしでしょうか。
通勤がないのはいいことなんだが・・
ちょっと飽きてきた感がないわけでもない。
そんな今日この頃。

私はAI-OCRにかかわる仕事をメインにしているのですが
そのなかで思うことなどつらつらと書いていきたいと思います。

AI-OCRの現状


ご存じですか?AI-OCRの市場ってすごく伸びてるんです。
昨年度と比べて約280%なんですよ。
まぁ、こういわれてもなぁ、280って胡散臭くねぇってなりますよね。
分かります、わかります、とってもよくわかります。
だって私もそうだもの(ヲイ)
でも事実です。
テレワークは今後も続くことからまだまだ伸びていくのではないかと思います。

AI-OCRはAIがあるから何でもできる!?


AIって言われているためにAI-OCRもすぐに何でもできる
なんて勘違いをされるケースが多いように思えます。
そもそもAIってどんなもんなんでしょう?
一般的にAIとは人間の知的ふるまいの一部をソフトウェアを使って再現しています。
経験から学び、新たな入力に順応し、人間のように柔軟に作業を実行していきます。
ディープ・ラーニングにより、大量のデータを使ってパターンを認識することで様々な難しい
タスクをコンピュータが実行できるようになります。
チャットボットなどでもすでに活用されていますよね。
AI-OCRのAIは、文字のパターンや帳票のパターンをディープ・ラーニングを行うことで
文字認識率の向上や帳票の読み取りなどが行えるようになるというものです。
AIだからといって自動で何でも勝手にできるわけではありません。
裏ではAI-OCRのAIもこつこつ頑張ってるんですよ。

AI-OCRでの文字の認識は?


文字の認識率はどんどん上がっています。
上がってはいますが100%はまだ先の話です。
帳票の書き方の工夫(AI-OCRに読ませるための)、DB(マスタ)との連携など
色々駆使することで限りなく100%に近づけることは出来るかもしれない。
でも、100%には出来ないんですね。
オンプレミスのAI-OCRを自分専用のツールとすると100%も夢じゃないです。
ひたすら自分の書く字を覚えこませればよいのです。
※ただ、自分専用のAI-OCRってどうなん?
どうしても人の書く文字は癖など千差万別、ゆえに認識率100は中々到達できないのではないかと
思っています。

認識率100%達成するためには

で、すさまじく暴論ですが私はこう思います。
「みんな習字を習おう、そしてきれいに字を書けるようになろう」
もう言ってることめちゃくちゃやん(って自分でも思いますが)
書類とかに手書きで字を書くときって、ちゃんと他の人も読めるのかな?
なんてことは考えてないですよね。
先日、とある理由で多くの書類に名前やら住所やら書きまくったことがあり
書いてる最中に
「あぁ、そういえば私はこういった書類に書かれた文字をデータ化するツールを提供しているよネ。
 なのにさぁ、こんなに汚い文字書いててえぇんだろうかと」
とか思いながらそもそも字が汚いからなぁとあきらめつつ・・・。
※そう思うならキレイに書くよう心掛けろよとかいう突っ込みも聞こえてきそうですが・・

書いてある字が綺麗なら認識率ももっと上がるんでないか―
って誰でも思うことを常々思ってるわけです。

最後に

でも、ボールペンで字書くのはちょっとなぁって方々
たくさんいらっしゃると思います。
だって私そうなんですもの。

でもね、私たちには美子ちゃんがいるじゃないですか!!
※誰?美子ちゃんって

手書き書類、ちゃっちゃと書きたい気持ちも分かります。
でも、ちょっと心に余裕をもって少しきれいに書くって事を心掛けてみても
いいんじゃないでしょうか。

このアドベンドカレンダーに参加しています。
https://adventar.org/calendars/4992


RPA Communityのイベントでも時々お話させてもらってます。
「AI-OCRの現状を知る!AI-OCRを学ぶ!」
https://www.youtube.com/watch?v=Xv_hVAhxIgs

この記事が気に入ったらサポートをしてみませんか?