書籍データの二次利用 その2 〜PDFから大量の画像を抽出する〜
今回は実際に作業したお仕事を紹介したいと思います。
お仕事の内容はPDFの任意の箇所から画像を抽出することです。
抽出した画像はクライアントが所有するアプリケーションに使われます。
PDFは各ページでレイアウトが共通しています。画像は解像度とファイル名に統一ルールがあります。
内容はそれだけです。
作業的にはたいしたことはありませね。
ただ、
量が、
とにかく、
多い!
PDFは書籍28冊分、対象は736ページ、1ページ内のPNG化する箇所は約10点、総PNG数は約7,5