歴史の論文を書いていると、史料の入力というのは厄介なものであって、それなりに時間が取られるものでもある。平仮名とカタカナの変換にF7を連打したりとかする。
それがどの程度楽になるかをちょっと試すために、竹林熊彦『近世日本文庫史』を次世代デジタルライブラリーで検索して、「この資料の全文データ」を選択してテキスト化されたデータをダウンロードした上で、例えばということで市川清流の建白書の部分を抜粋したのが以下。
ただしこの作業では、コマ数を確認しておくことが必須となる。
ここから史料を引用して論文に使用する際には、もう一回原本との照合しなければ怖くて使えないところではあるが、旧漢字を常用の字体に直したりとか、また誤記や読み取りミスが無いかを確認する作業時間は、それでも手で入力するよりは早いかもしれない(同じ文字を変換するならこれを貼り付けたWordファイル上などCtrl+Fを押して置き換えるのでもよさそう)。カタカナの「ニ」が漢数字の「二」とかだったりするのはちょっとめんどくさそうだけれど。
途中で平仮名になってたり「変かな?」と思うところはあるけれど、これは人力で入力したって見直ししなければ間違いがあるだろうから、精度としてはなかなかのものに思われる。
とくに明治期の漢語が多いものであればなおさらだろう(ルビが入っていたり、レイアウトが2段組のものになったりすると急に難しくなったりとかはしそう)。とはいえ少しでも早く入力でき、論文執筆にかかる時間を短縮できるようなtipsとして一応候補にしておきたい。