マガジンのカバー画像

ぱいそん3がかけるようになりたい。

73
python3の学習記録あれこれをまとめています
運営しているクリエイター

#poppler

【Tesseract+Poppler+Python】Windows環境で実行すると日本語テキストが消え失せる件と対策

わーいpythonでOCR出来るようになったぞー、と思って色んなデータ突っ込んでみたら早速、テキストがあるはずなのに「テキストが空っぽやで~」って言われる、という事件が発生したので対処をまとめます。

日本語テキストデータが入っているPDFはWindows環境のPopplerが画像化出来ない中間データを追っていったところ、ここが悪さをしていました。
PDFをjpg化する時点でテキストが全部消えます

もっとみる