OCR

Google製OCRライブラリの「Tesseract」をEmscriptenでラップした「Tesseract.js」で日本語OCR試してみる

OCRしたい場合どうするんやろ?  OSSで日本語対応してるやつあるんか?

TesseractっていうGoogle製のOCRライブラリがあるんか!

Webブラウザで動作するようなJavaScriptのOCRライブラリはあるんかな?

Tesseract.jsってまんまなJavaScriptライブラリあるやんけ!

精度どんなもんやろか? ← イマココ

タイトルの「Emscripten」は

もっとみる

株式会社ダブルスタンダードのOCR

ダブルスタンダードのOCR処理技術基盤

データクレンジングの技術基盤(データ収集・データ抽出・データ加工)が完成し、デジタルデータ・アナログデータ問わず汎用性が高く展開できている点

ダブルスタンダードの提供するOCRソリューションでは、これまでのビッグデータ処理で培ってきたデータクレンジング技術と最適なOCRエンジンの組み合わせにより、圧倒的な文字認識率を実現

ダブルスタンダードのOCR導入

もっとみる

文字起こし君(DaiさんLINE Bot)難しかったところメモ

本noteを書く理由

自分が諦めかけていたとき、他の人が「出来た!」と書いた記事(リンク)を見て、

「本の通りで出来るんだ」「もう一度やってみよう」

と勇気をもらえました。
このnoteが、私のように諦めかけた人の一助になればうれしいです。
(文字起こし君は、Daiさんが作り方を紹介しているLINE Botの名称です。)

2019/10/22 に完成!

本の通り、コードを書いていれば出来

もっとみる
ありがとうございます!お役に立てれば幸いです💛
2

株式会社ダブルスタンダードのサービスHTML情報活用②:自社データ強化

HTML情報活用

当社クレンジング技術を活用して高精度のデータを生成。競合ポータルの分析や、営業用のアタックリストとして活用いただけるデータを提供

事例:自社データ強化

課題

顧客が登録する店舗情報に誤記が多い。サービス向上のために、正しい情報に修正したいが方法がわからない

提案ソリューション

顧客保有の情報と、政府が管理する情報とのマッチングを実施。情報の統一化をはかることにより、デ

もっとみる

株式会社ダブルスタンダードのサービス HTML情報活用①:競合出稿分析情報

HTML情報活用

当社クレンジング技術を活用して高精度のデータを生成。競合ポータルの分析や、営業用のアタックリストとして活用いただけるデータを提供

課題

自社クライアントの、競合サイトへの出稿状況を知るために、データ収集してきたが、ゴミだらけ、名寄せが出来ないなど、不満足なものでしかない

提案ソリューション

顧客企業のリクエストに基づいて、競合データと顧客管理データを突合せし、競合分析や

もっとみる

くずし文字認識AIがあるんだから手書き文字認識AIもそろそろだな

幼い頃から大学生まで、バレエを習っていた。
スタジオで練習するときは良い。
先生が爆音で音楽を流してくれるから。

しかし家で練習するときはとても困った。
当時はコード付きのイヤホンしかなかったため
レッスンの内容を復習して体を動かしていると
手と足に無限に絡まるのである。

(バレエのレッスンをご存知ない方向けイメージ)

上記の動画にイヤホンコードを脳内レイヤーで乗算してほしい。
地獄である。

もっとみる

古文書『くずし字』AIが瞬時に解読!もしや、我が家の古文書の解読も可能か!?

NHKニュースでも取り上げらていましたが、
古文書の『くずし字』。
AIで、ほぼ解読可能になったと取り上げられていました。
その名も、

くずし字 解読ソフト『KuroNet(クロネット)』

開発の主担当者は、カラーヌワット・タリンさん。
なんと、タイ出身の方です。( ̄口 ̄*)

タリンさんは、源氏物語に興味を持ったのが始まりだそうです。

早稲田大学に留学して、研究者の道をスタート。
専門家で

もっとみる
スキありがとうございます!これからもよろしく御願いします
149

ブラウザでWebカメラ制御&OCR処理してみる

OCR is 何

光学文字認識(こうがくもじにんしき、Optical character recognition)は、活字の文書の画像(通常イメージスキャナーで取り込まれる)を文字コードの列に変換するソフトウェアである。一般にOCRと略記される。

Wikipedia

カメラで写真撮ったり、スキャナで取り込んだデータを文字起こししてくれるあれです。
サーバサイドで処理してそうな機能ですが、ブラ

もっとみる

【NL研発表】漢字のOCRエラー訂正手法

10月25日と26日の2日間、奈良先端科学技術大学院大学(NAIST)で情報処理学会 第242回自然言語処理研究会が開催されました。

「NL研」と呼ばれるこの学会で、横浜国立大学大学院の阪本 浩太郎さんが、Genial Technologyのサポートのもと、漢字のOCRエラー訂正手法について論文発表を行いました。

この記事では、OCRのまわりで何が起こっているのか、この手法がどんなインパクトを

もっとみる

工数削減のイメージがつかめた!2019年10月23~25日AI・業務自動化 展【秋】

DOAです。

2019年10月23日~25日、幕張メッセで行われたAI・業務自動化 展【秋】(以下、AI自動化展)に行ってまいりました。

現業務の工数削減できるきっかけ等々が明確にイメージできた、今回の展示会。
早速ピックアップしてシステム試用を開始中です(夜中なので申し込みだけ)

今後のメモと、自動化メモにちょびっと全体外観所感を書いてみました。

AI自動化展とは?

リードエキシビジョ

もっとみる
ご参考になれたのなら幸い
2