見出し画像

感染症対策料30円に爆笑! 「0045夜 続OCR、写メ画像で遊んでみた!」

昨夜の最大震度6強の地震、びっくりしました。「長い」地震、2011年3月11日を思い出させますね。
さて、昨日の投稿をした後、写メ画像のOCRにも挑戦したいなぁと思っていました。飲食店の閉店時間が早い毎日なので、早めに居酒屋に言って全集中で「1時間飲み放題」に挑戦して、会計レシートを見てみると「感染症対策料30円」の文字が目に入り、脳内大爆笑!写メのネタはこれに決定。

レシート画像1、ヒキ

「感染症対策料」がちゃんと読めれば良いなと思ってやってみました。下の画像をTesseractで読み込みましたが、なぜかメニューの中の最初の1文字「感」などが読めませんでした。

画像1

OCR結果(Tesseract実行)
------------------------------
2021和62月13B 168
人 衝55分 。 1名

人 No- 00191 テ-7ル 032
遇F
1H飲放 572円 1個 \572
#Y-ゲ 人間 1個 \438
染症対策料 1個 \30
ぐる掘り 1個 \438
412もつ者込 1個 \546
413ゲャが塩辛 1個 \438
ニュー
内税品『 \2, 464
ーート>、 22
は イー・和464
\224)
\3,065

\ら01

2
------------------------------
(OCR結果ここまで)

レシート画像2、ヨリ

「感染症対策料」の部分が脱落なく読み取れるのが目標だったので、下の画像ではメニューの部分を切り出したのですが、、、
確かに「感染症対策料」の文字は正しく認識されましたが、なぜか個数と金額の欄が全く読まれず悲しいです。

画像2

OCR結果(Tesseract実行)
------------------------------
ーー

1H飲放 572円

メニュー

パーツ′ お通込

感染症対策料
まぐる握り

412もつ煮込

413ゲャが 塩辛

En

\2, 464

内税品計
------------------------------
(OCR結果ここまで)

2021年2月14日のコメント

文章に比べてレシートのような文字がバラバラに配置された素材は、読み込みが難しいのかもしれません。次回連続的にOCRを取り上げるかどうかはまだ分かりませんが、「縦書き」の読み取りにもいずれ挑戦する予定です。パラメータでjpn_vertをつけて日本語縦書きを指定するようです、、、
では、また明日、お目にかかりましょう!

この記事が気に入ったらサポートをしてみませんか?