PDF解析比較の致命的な弱点

Adobe Acrobat DC PROのPDF比較機能は解析比較方式です。二つのPDFのデータ構造を解析して付き合わせて比較します。

この方式の弱点は二つ。

- 時々比較もれが起きる
- 動作が重たい

1 の説明は『AcrobatのPDF比較で痛い目にあった話』を参照してください。

2 は時としてもっと厄介です。例えば100ページを超える二つのPDFを比較しようとすると、前処理に長い時間がかかった挙句、比較中にアプリが異常終了して時間が無駄になることも多いので。散々待たされた上に途中までの比較結果さえ提示してくれないという。

もちろん50ページずつに切り分けて別々に比較することはできるけど、面倒ですよね。場合によってはもっと細かく分けなければならないかもしれないし。

ちなみにXORなら100ページかそこらならへっちゃらだし、PDFを読み込んだら前処理もなくすぐに比較を始められます。

この記事が気に入ったらサポートをしてみませんか?