【覚書】PythonでPDFのテキストミスチェックツール作った
目的PDFのファイル名とPDFに記載されたテキストの不一致を自動で発見する。
判定する対象と内容【対象ファイル形式】
PDFデータ
【やりたいこと】
PDFに記載されているテキスト内に、ファイル名と完全一致するテキストがあるか判定したい。
Pythonの環境が無い人も使えデータにして配布する前提で作る。
【ねらい】
誤字脱字防止、チェック時の手間削減
【できたらいいな】
フォルダ内全てのPDFをまとめて判定したい
判定の表示はアルファベット順に出したい
追加機能として