見出し画像

ブッククリップさまさまっす

OCRでテキストを電子化するという作業を細々とやっております。目測でも文章をチェックしながらデジタル化ということでパソコンにテキストを取り込んでいくのですが、スマホのカメラのほうがタブレットPCのカメラより優秀だな、という感想をもちました。実践してみてわかることというものはありますね。

あと、本を物理的にどれだけフラットにできるかでスキャンと読み込みの精度が変わってくるということ、カラチャイ・バルカル語やクムク語よりもトルコ語やアゼルバイジャン語のほうがOCRの読み取りの精度が高いことあたりも、実際に取り込みをやってみての実感です。

サハ語は…ためしに1ページだけ、「レオン・ヴェルトへ」のところをやってみたのですが、サハ語独特の字母である"ҕ"が全く読み取れないようです。"б"か"г"のどちらかになってしまうのですよね。

さすがだ。おそるべしサハ語。
テキストとして取り込むには、かなり手間がかかりそうな言語だなということはわかりました。この調子だと、ほかのキリル文字使用言語も同様に手間がかかりそうだな…という感想です。

カザフ語など、いったいどうなることやら。まだ試していませんが、近々そういう言語も春以降やってみるとしましょう。

さておき。本を物理的にフラットにした状態でスマホでスキャンするという話ですが、今使っているツールとしてはこの2つです。

ブックスタンド、今までは1000~1500円台くらいのものを使っていたのですが、えらいものでブックスタンドもそれなりの価格のものだと使いやすいというか、固定しやすくて大変スキャンするのによいですね。

そして、決め手はこれ。重みのあるブッククリップです。

このクリップのおかげで、Google Lensの読み込みの精度が格段に上がったと思います。もちろん100円代で売っているよく見かけるアルミのクリップでもよかったのですが、本に物理的な傷がつきやすいということが気になっていました。

その点、上記のクリップは挟む部分の内側にフエルトが入っているので、本にもやさしい仕様になっております。念のため3つ買ってみたのですが、1つだけでも十分のようです。

ということで気長な作業にはなろうかと思いますが、先日も書いた通りこれも地味な「テュル活」の一環ということでやっていこうと思います。何より、テュルク諸語のいろいろな例文を見ながらの作業ですから、それをやるだけのメリットはきっとあると思いますのでね…

そんなわけで、みなさんにもブッククリップとブックスタンドをオススメしておきます。日曜日のひと時、本を読みましょう(自分が)、そして読ませましょう(PCに)。

この記事が参加している募集

#買ってよかったもの

58,947件

記事を最後まで読んでいただき、ありがとうございます。Çox təşəkkür edirəm! よろしければ、ぜひサポートお願いいたします!いただいたぶんは、記事更新、また取材・調査のための活動資金に充てさせていただきます。