フォローしませんか?
シェア
yucco
2021年12月24日 17:19
完全に将来の自分が思い出すためのメモ記事です。目的一般的なフォーマットの書類を普通にOCRすると請求書A社御中A社の郵便番号 発行:B社A社の住所 B社の住所 社A社担当者名 B社担当者名判こんな感じのテキスト(実際はさらにぐちゃぐちゃ)になっちまうので、「宛先情報エリア」「発行主情報エリア」「金額記載エリア」と分割して読み取らないと二進も三
2021年12月21日 15:41
pythonでOCRをするぞー! ということで、Tesseractを導入してみたいと思います。pythonで動かすまでに色々躓いたので、導入ステップ覚え書きです。①TesseractをインストールTesseract自体はpythonのモジュールではないので、普通にwindowsにインストールします。こちらを参考にしました。日本語モジュールの追加が必要なので、その辺りの手順は画像付きのこちら