winOCRでポケモンの名前認識してみる

2022年1月16日 00:22

はじめに

ポケモンの認識で、Tesseractやgoogle cloud vision APIを使ってる人は見たことあるのですが、winOCRを使っている人はあまりいなかったのでまとめておきます。

ざっくり比較

Tesseract→認識精度普通、別でインストールが必要。
winOCR→英語、日本語なら別でインストール不要。認識精度普通。
google cloud visionAPI →認識精度神。一定枚数超えると有料に。

コード

import time
from PIL import Image, ImageChops, ImageFont, ImageDraw
import winocr
from winrt.windows.globalization import Language
from winrt.windows.media.ocr import OcrEngine
img = Image.open('buru.jpg')
result=winocr.recognize_pil(img,'ko')
time.sleep(0.5)
print(result.get_results().text)

recognize_pilメソッドで画像を認識して、認識結果をget_resultsメソッドで取得するだけ。案外簡単。
読み込みに多少時間がかかるのとおそらく並列処理になっているのか、多少時を止めないとget_resultsメソッドでバグる。
'ko'のとこを’ja’にすると日本語、'en'にすると英語など決まっている。
なぜか中国語のコードは分からなかったが、韓国語の'ko'で認識できた。