機械学習の学習経過・2

昨日から再開しようとした機械学習。
継続は力なり、ということでこの連休はちゃんと何かを見てみることに。

Unityで動くサンプルのいずれも「学習済みモデル」というものを利用しているのでそこを差し替えることで挙動が変わることは想像できる。
手書き文字認識の認識対象が数値のみ(MNIST)なのでそれを違うモデルにすることでアルファベット、日本語を認識できるのでは?と考察。

ただ入力フォーマットは同一か?戻り値の型は何なのか?など、学習済みモデルの設計?内容によって違いがあると思うので学習済みモデルの配布サイトなどで確認する必要がありそうだし、学習済みモデルを自作する場合はそういったインターフェイスについても考える必要がありそうだ、と。

日本語のOCRをPythonで行なっているブログをみたが、学習済みモデルは非公開だったので学習用のデータをどのようにしているのか?は考える必要がありそう。
(手書き日本語文字画像の用意の仕方、学習用プログラムの移植など)

まずは公開済みモデルで「利用する側のケース」を学ぶのも必要と考え
アルファベットの学習済みモデルもで探してみようか
(どう検索するのが正しいのかわからず、まだ見つかってない)

この記事が気に入ったらサポートをしてみませんか?