見出し画像

俳句編その2・そうだ 自炊、しよう

そうだ 自炊、しよう。
ある晩、JR東海のコピーのようなことを、考えた。

「自炊」といっても、料理とは関係ない。
ここでは、本をスキャンして、電子データにすることを指す。

本がたまる

俳句の世界は、アナログな世界であった。ある程度は覚悟していたが。

句集も雑誌も、紙ベース。
全句集が出るような有名な俳人でも、句集が電子書籍で出ているのは数えるほどである。
正岡子規や高浜虚子クラスの有名な俳人でも、である。

紙の本を、最初は図書館で借りた。
そのうち、手元に置きたくなって、購入した。
その結果、本の山が寝る場所を圧迫するようになった。地震が起きたら、きっと本の下敷きになるだろう。

句が探せない

紙ベースだと、句が探せないという問題もあった。
以前の方法であれば、ぱらぱらめくって、目に留まった俳句をツイートしていけばよかった。
しかし、今の方法、写真を元に俳句を選ぶ方式だと、この手は使えない。

季語索引(季題索引とも。ここでは「季語索引」で統一する)を頼りにする。
チューリップの写真であれば、季語索引で「チューリップ」を探す。
しかし、ちょっと前に発行された句集だと、季語索引がないものが多いのだ。
具体名を挙げると、日野草城、楠本健吉、平畑静塔といったところ。
出版社の事情によるのかもしれない。

季語索引があったとしても。
たとえば「猫」という単語が含まれる句を探したいとする。
「恋猫」「猫の子」のような、季語になっている俳句は探し出せる。
しかし、夏や秋や冬の句で猫が登場する句はヒットしない。
たとえば、こんな句である。

そう、加藤楸邨の全句集。最近出たものを、思い切って購入した。
上下2巻組。合わせて1500ページ以上。『広辞苑』級である。
書店で購入した時、さすがに手が震えた。

話を戻す。
『加藤楸邨全句集』には季語索引がある。作るのは大変だっただろうと思う。でも、紙の本だと、調べるのも一苦労である。

自炊してしまえば、PCの中だけで完結する。
運よく、テキストファイルにできれば、複数の句集の串刺し検索も夢ではないだろう。

でも……

そして、決心

1ヶ月以上、悩んだ。
わたしは、本が好きである。書かれた内容だけでなく、本というオブジェを愛している。
その本を、裁断してスキャンして廃棄してしまうなどという大罪を犯していいのだろうか?

現代日本では、本をスキャンした電子データを販売することは、著作権法で、できない。

本の複製の権利は、著作権者(具体的には著者や著者の遺族)や出版社にある。
最近発売された本に「電子的複製を禁ずる」旨の注意書きがあるのは、そのためである。
本の自炊が流行りだしたころ、2012年ごろと記憶しているが、自炊を代行してくれる業者も存在したと記憶している。今は見当たらない。出版社側が起こした裁判に負けたらしい。

でも、せっかく購入した本が、利用されずにこのまま死蔵されてしまうのも哀れである。
日野草城が、楠本健吉が、平畑静塔が泣く。

私的複製ということであれば、著作権法上も、問題ないはずだ。
自分でお金を出して買った本、裁断しようがスキャンしようが廃棄しようが漬物石にしようが、他人の迷惑にならなければ文句を言われる筋合いはない。
自炊したデータを売ったり人にあげたりすることはしない。あくまでも、わたしのPCの中だけで完結させる。
わたしが死んだら? 相続するパートナーも子どももきょうだいもいない。いとこは何人かいるけれど、離れて住んでいるし、ほぼ年賀状のやりとりだけのつきあいしかない。彼らが役に立ててくれることは、きっとないだろう。

稀覯本、つまり古書店でも入手困難な本はどうしよう。
たとえば、手元の本の中では『横光利一句集』。非売品である。価格は数千円だったが、装釘も愛らしく、裁断してしまうのは惜しい。
……まあ、そのときに考えよう。

まず、裁断

文庫本の自炊なら過去に経験している。でも、ハードカバーは初めてだ。

本の自炊をするには、まず、本を裁断する必要がある。
文庫ならともかく、分厚いハードカバーは、何万円もする大きな裁断機が必要になる。
たとえばこんなものである。

個人で所有するには、大きいし、重いし、刃の交換などメンテナンスがたいへんだ。
業務用裁断機を使えるプロに頼もうと思った。

ネットで調べると、裁断をしてくれる業者が、いくつか見つかった。
そのうち、目星をつけた業者に、メールで問い合わせてみた。
誠実そうな返事を送ってきた業者に頼んでみることにした。
ブックカットジャパン。九州の業者である。

5冊無料のお試しコースをお願いした。
段ボール箱に5冊、分厚いハードカバー本を詰めて宅配便で送ってみた。

何日後、同じ箱で返送されてきた。
送った5冊が、きちんと裁断されて、表紙と裏表紙ではさんで輪ゴムで十字に束ねられていた。
挟んであったチラシ類も、きちんと添えられていた。

ここなら大丈夫だ、と思った。
関西から九州。送料はかかるが、信頼できるに越したことはない。

スキャン

スキャナーは、定番のScanSnapにした。

もっと安い機種もあるのだが、ケチるのは止めようと思った。
ブラックもあるのだが、ホワイトを選んだのは、趣味の問題である。

使い方は簡単だ。ケーブルを繋いで、電源を入れる。あとは、ScanSnap側のタッチパネルで操作する。
最初の1回だけは、PCにドライバーのインストールが必要だ。でも、難しくない。箱の中の紙に書かれたURLにPCでアクセスすると、ドライバーやユーティリティソフトがダウンロードできるページに飛べる。

iX1600はWi-Fiに対応している。スキャンしたデータをクラウドに保存することもできる。でも、その機能は使っていない。扱うデータが大容量になるからだ。

裁断した本を順番にセットする。
1冊全部は無理。200ページ程度ずつ、目分量でセットしていく。
両面スキャン。解像度は最高の600dpiで、カラー設定は自動。最低限気をつけるのはその3点。

ちゃんとスキャンできたことを確認してから、裁断した本は廃棄する。
さようなら。あなた方の魂は我がPCにある。あなた方のことは忘れないよ。

そして、OCR

スキャンしたPDFファイルは、そのままでは単なる画像の集合体である。
OCRにかけて、何が書いてあるか、活字をテキスト化する必要がある。

OCRソフトを、2、3点購入して、試してみた。
惨敗だった。
OCRソフトは、横書きのビジネス文書をテキスト化するのに特化している。句集は縦書きが基本。読みこませても、横書きの文書と認識してしまうのだ。

それに、扱えるPDFファイルのページ数に制限があるようだった。
『加藤楸邨全句集』上下巻を1つのファイルにしたものを読みこませてみた。1000ページでエラーが出た。

結局、現状では、テキストファイル化は無理。
Adobe Acrobatに頼ることになった。
PDFファイルを開いて、Ctrl+Fキーでキーワードを入力する。次へのボタンをクリックすると、キーワードにジャンプする。
「薔薇」が「薔」と「薇」に分かれて認識しているようなことも起きるが、やむを得ない。
基本に帰れ、ということだろう。


大学のテキストも、この調子で、自炊しよう……

いただいたサポートは、本や美味しいお菓子、写真道具を買うのに使わせていただきます。