【実質0円大学生活のすすめ】第60回:デジタルデバイスを使いこなす（13)スキャンデータの後処理02

2023年3月12日 18:00

前回、書籍などの紙データをデジタル化したときのダウンサイジング効果について具体的に検討してみました。今回は、デジタル化した際のインデックスの重要性についてみてみましょう。

100MBというと、300ページ程度の書籍をグレースケール（白黒2色よりも階調のグラデーションがあるもの）の解像度400dpiでスキャンしたときに得られるファイルサイズです。フルカラーだと300MB程度になるでしょう。

【300ページ程度の書籍の場合】
グレースケールで解像度400dpiでスキャン　＞　約100MBのPDF
フルカラーで解像度400dpiでスキャン　＞　約300MBのPDF

手のひらサイズの4TBの2.5インチHDDであれば、1万5000円程度で買えます（2023/03/11現在）。

そこに書籍をスキャンしたPDFデータを入れるとすると、グレースケールの書籍なら4万冊、フルカラーの書籍なら1万3300冊が保存できるのです。

もし、数万個あるそれぞれのファイルに適切なファイル名が付与されていなかったとするとどうなるでしょう？

必要なときに必要なファイルが見つからない事態が発生します。部屋の中にあれば、目視で順番に確認していくと、時間がかかっても見つけられるでしょう。しかしながら、デジタルの世界では見つけられない可能性があります。

OCRが掛けられていれば、全文検索でなんとか探せるかもしれませんが、ファイル名が日付のみなどであれば絶望的です。

そのような事態を防ぐためには、ファイル名を工夫しておく必要があります。次回は「ファイル名の付け方」を紹介します。

-アナログデータをデジタル化すると保存スペースが劇的に少なくなる
-例えば数万冊の書籍が手のひらの上に乗るハードディスクに収納できる
-しかしながら、適切なファイル名をつけておかないと探し出せなくなる

この記事が気に入ったらサポートをしてみませんか？