【本日の活動】Pythonで画像の文字をテキストとして出力
こんにちは(@t_kun_kamakiri)
本日の活動をまとめておきます('ω')ノ
Pythonで画像の文字をテキストとして出力
製造業ブロガーのコミュニティの方からブログのキーワード分析のために「参考書の索引の写真を撮って、そこから関連キーワードのスクレイピングができないか」という相談をもらったのでさっそくやってみました。
問題は「画像内の文字をどのようにテキスト認識させるか」ですね。
↓こちらの記事を参考にして、使い方を確認しコードを少しいじりました。
結果、2時間ほど試行錯誤して何とかできそうであることが確認できました(^^)/
コードはまだテスト段階ですが参考程度に記載しておきます。
from PIL import Image
import sys
import pyocr
import pyocr.builders
tools = pyocr.get_available_tools()
if len(tools) == 0:
print("No OCR tool found")
sys.exit(1)
tool = tools[0]
print("Will use tool '%s'" % (tool.get_name()))
langs = tool.get_available_languages()
lang = [lang_ for lang_ in langs if lang_ == 'jpn'][0]
print(lang,type(lang))
print("Will use lang '%s'" % (lang))
print("Available languages: %s" % ", ".join(langs))
txt = tool.image_to_string(
Image.open(r'data/22222.PNG'),
lang=lang,
builder=pyocr.builders.TextBuilder()
)
print(type(txt),len(txt))
print('='*50)
print(txt.split('\n'))
txt_list = txt.split('\n')
print('='*50)
print('='*50)
for t in txt_list:
if t == '':
pass
else:
print(t)
Pythonでスクレイピングするためのライブラリをまとめた
昨日、関連キーワードのスクレイピングのスクレイピングというのができました。
こちらはざっくり3時間ほどかけて出来上がりました。
ただスクレイピングするためのライブラリとそのライブラリの使い方を逐一公式ドキュメントで確認してコード作成したため結構時間がかかった印象があり、この際きっちりまとめておこうと思ったわけです。
だいたいスクレイピングで使うPythonのライブラリは以下です。
【使用するライブラリ】
●requests
●BeautifulSoup(requestsとセットで使う)
●selenium
●lxml
それをGoogleスプレッドシートにまとめておきました。
これで同じコードなら1/3くらいの時間で作成できるかもしれません(^^)
ココナラの物理質問対応
1時間ほどココナラで依頼があった解答作成をしていました。
手数料差し引かれての金額が3800円です。
1時間ほどで解答・解説を作成したので時給3800円です。
結構いいですね(^^)
自然言語処理の勉強開始
本日よりこちらの書籍を読み始めました。
2月~3月の間に、
●スクレイピング
●自然言語処理
●画像認識
●機械学習
をひととおり学ぼうという計画です。
スクレイピングの勉強➡noteに書く
自然言語処理の勉強➡noteに書く
以上を毎日していきたいと思いました・・・・
が、参考書の推奨が「WSLのubuntuPythonを動かす」という内容なのですが、手元のPCのWSL内のubuntuのバージョンが古く、Pythonも3.6とちょっと前のバージョンだったのでアップデートしようとしたらエラーが出てどうしようもなくなったのと、パソコンも古くてファンが「ギャンギャン」いうのでubuntuごとアンインストールしました(笑)
そして、パソコンを新規で買おうという決断に至りました・・・・
ただ、今のパソコンはまだ使えるのでwindowsにPythonの本家が入っているのでそちらを使おうかなと思います。
Twitter➡@t_kun_kamakiri
Instagram➡kamakiri1225
ブログ➡宇宙に入ったカマキリ(物理ブログ)
ココナラ➡物理の質問サポートサービス
この記事が気に入ったらサポートをしてみませんか?