見出し画像

スキャン画像からテーブルを抽出するExtractTableが素晴らしい

うちの分野はデータ生産スピードがそんなに速くないので、20年前くらいの文書のスキャンされたものからデータ抽出してくるとかよくあります。というかそのためにOCRソフト買ったこともある。

最近はテーブルの画像からテーブルを抽出してくるサービスとかよくあるなと思いつつ、いっぱいありすぎてよくわからんなと思っていましたが、ちょっとまとめてデジタル化する機会があったので何サービスかためしてみたところ、出会ってしまいました。

ExtractTable、これがマジ最強です。(少なくとも今の時点では。)

1日2画像フリーでトライアルできるのでまあやってみればわかるそのすごさ。OCRのだめっぷりに何年かで慣れきっていた筆者は痺れました。

何がいいって、もちろん正確さが第一なんですが、UIがめちゃいいんです。

  • 課金するための謎のアカウント登録いらん(APIキーで動く)

  • 課金したらスクショのコピペでアップロードできる

  • ちょっと自信がないセルをハイライトしてくれて、手で修正してからダウンロードできる

  • 解像度低めの画像でもけっこうなんとかなる

  • ちゃんと過去のログが残る

  • 各種ツールとの拡張性が高い

  • 処理速度が速い

  • 結果が見やすい(OCRにありがちな情報過多さがない)

  • 各種ツールとの拡張性が高い

  • そしてお値段もめちゃくちゃ手頃。(1年間有効な50回トークンで500円くらい)

ちなみに3つのプランがありますが違いはあんまりわからんかったので誰か解説してほしい。(トライアルがどのプランなのかもよくわからん)

正確さについては必ず100%というわけでなくたまに堂々と間違えてたりするのでそれはご注意を。AI系のOCRは端っこミスったりはしがち。どうしても数字のほうが得意で、文字のほうが「自信がない」になることが多いですかね。でも他のサービスの比ではないと思います。ちなみにものすごい間違いがあったら返金してくれるとか?(試したことはない)

残念ながら日本語は対応していませんが、対応する日が来たらすてきだろうなあ。DeepLのような一点特化型サービスの強さを感じました。


この記事が気に入ったらサポートをしてみませんか?