OCRでGo! 裁断器は必須か?

まず献体をひらきにする

 理想はやはり無傷で献体をスキャンする非破壊自炊だが、残念ながらいまだに主流にはなっていない。ページめくりの自動化が望ましいが、機械的なカラクリでページを1枚ずつエラーなく高速でめくるという動作は、世界中の頭脳がいまだ挑戦しているが、生憎とべらぼうに難しい。従って、やはり背表紙を切り離し全ページをバラバラのペラにした献体を、紙幣計数機のごとくスキャナに食わせてガーッと一気にスキャンする破壊自炊が現実的な落としどころであろう。

 文庫本の背表紙をバッサリと切り離すには、ゴツい裁断機で一刀両断にするのが主流だが、筆者はこの手法をかねがね疑問に思っていた。

 綴じてある側を切り離してペラにするのに際して、裁断機では綴じていない側を固定して、ブレードを振り下ろして切断するが、

画像3

 ページを真ん中から折り開き、


画像4

 綴じてある側を固定して切断すれば、切られた瞬間にページはフリーになってブレードから離れることで切断抵抗を減らすことができる。

画像3

 ならばもっと積極的に仕組みを傾けて、ページが切られながら離れていくようにすれば、単なるカッターであってもそれなりのページ数をバッサリ切り離せるのではないだろうか。

画像4

 勿論一発でバッサリ裁断できるのはハナシが早いのだが、こういう工夫によってもそれなりにできるかもしれないということで。

ではスキャナーに食わせてみよう

 一枚ずつのペラになったら、スキャナーにかけてみよう。

 釘くんたちは仕事だから、合法的に会社の複合機を使えるみたいだが、そうでない場合は個人で会社の備品を無断使用する訳にはいかないだろう。では時間当たりいくらかで使わせてくれるようなサービスは? というと、やはりスキャンする元ネタが著作権に直結するからか、これが案外ない。ページ当たりいくらのサービスはあるが、本一冊やっていたら破産しかねない。

 民生用スキャナーを買って自分で使う場合は後述するが、何らかの事情で合法的にオフィスの複合機でスキャンできる場合は、せいぜい感謝して使わせていただこう。なんといっても一度に多数のペラを装填できる上にスキャン速度が速いからだ。

 複合機でスキャンする場合の設定は、『片面スキャン・解像度300dpi以上・モノクロ・tiff形式で保存』が基本である。

 複合機のスキャナは片面にしかスキャンユニットがないはずだが、メニューには両面スキャンがある。一体どうやっているかというと、片面をスキャンし終わったら紙を逆走させて、今度は裏面を読むという二段構えのスキャンをしている。これは時間がかかるし反芻するので紙への負担も大きい。従って、奇数ページと偶数ページを片面ずつ全ページスキャンして、あとで合体させることにする。

スクリーンショット_2020-10-29_15-12-29

 ソーターと呼ばれる自動紙送りにペラをセットすると、上から順に紙送りをするので、偶数ページか奇数ページか、どちら側は逆順に読み込まれることになるが、これはあとで逆順にひとつおきに連番を振り直せばよい。おそらく文字が90°傾いた状態になっているだろうが、これもあとからなんとでもなる。

 但しソーターにセットできる紙の小ささには限度があり、また結果たる.tiff形式の画像もCCITT G3圧縮とCCITT G4圧縮とあって(もっとあるのかは不明)、複合機メーカーによって違いはあることには留意されたし。

画像6


この記事が気に入ったらサポートをしてみませんか?