![見出し画像](https://assets.st-note.com/production/uploads/images/88301652/rectangle_large_type_2_80df0e5c780a421270f92a5e6639b742.jpeg?width=1200)
日本薬局方のPDFファイルをpythonでtext保存する
PDFファイルをtextエディタに変換して、保存する方法です。
医薬品でQCを担当する場合、試験法のSOPを作る時、日本薬局方の文書を引用することが多いです。
そんな日本薬局方をtext化する方法です。
①厚生労働省のホームページから、日本薬局方のPDFをダウンロードします。
②ubuntuのターミナルで以下のコマンドを入力し、pdfminer.sixをダウンロードします。
![](https://assets.st-note.com/img/1664894631329-X8sfpeGLqj.png)
③pythonの環境で以下のコマンドを書き、python3で実行します。筆者はVScodeで行いました。
from pdfminer.high_level import extract_text
text = extract_text('000788359.pdf')
f = open('myfile.txt', 'x')
f.writelines(text)
f.close()
![](https://assets.st-note.com/img/1664894749178-WEQifO1cXs.png)
④以下のようにtextファイルが作成され、中身も保管されました。
![](https://assets.st-note.com/img/1664894944807-teZSRl2POK.png)
![](https://assets.st-note.com/img/1664894955041-J6BoHVX0oH.png?width=1200)
この記事が気に入ったらサポートをしてみませんか?