見出し画像

【Python】PDFの各ページをPNGに変換するスクリプト

PDFの各ページをJPGに変換する作業を自動化したいなと思う場面があり、ジモティで知り合ったプログラミング友達に教えてもらいながら、Pythonで書いてみました。

GASと違い環境面で躓く事があって、難しいなぁと思う事がしばしばあります。

上記のリンクを参考にしたのですが、環境設定などなかなか難しいなぁと思うところがあり、もっと片手間で出来ないかなぁと思っていました。

実行環境

・Windows 10
・Anaconda
・Python 3.7

pipのアップグレード

pip install PyMuPDF
pip install --upgrade pip

カーネルを再起動してください。そんな感じのエラーが出ていたのですが、pipをアップグレードする事で回避することが出来ました。

実行するソースコード

import fitz
import os
from pathlib import Path

#ダウンロードフォルダに保存したPDFファイル
os.chdir(r"C:\Users\*ユーザー名*\Downloads")
print(os.getcwd())


#今回は日経新聞.pdfを処理対象とする
pdfFile = Path(r".\日本経済新聞.pdf")

#PDFファイルを開く
pages = fitz.open(pdfFile)

#保存先を変更する
os.chdir(r"C:\Users\*ユーザー名*\Downloads\pdfToImage")

#連番をつけて保存する
for page in pages:
    pix = page.get_pixmap()
    pix.save("page_%i.png" % (page.number+1))

この記事が気に入ったらサポートをしてみませんか?