機械学習のアノテーションツールVoTTを使ってObject Detection(物体検出)の学習データを作成した

iOSで自作のモデルを使ってObject DetectionをするためにOSSのアノテーションツールVoTTを使いました。

VoTTはMicrosoft製の動画に対応したアノテーションツールです、GUIも付属しています。若干癖もありますがショートカットキーも用意されているので慣れるとサクサク使えます。上記のケースでは1オブジェクト辺り数10枚のアノテーション作業と画像切り出しをしたので最終的には数百枚になりました。

基本的な使い方は@shu223さんの記事にあるリンク先を参照してください。

VoTTはmovファイルに対応していないためiPhoneで撮影した動画がそのまま読み込めず、mp4に変換するためにffmpegのインストールも考えましたがiMovieにドラッグ&ドロップするだけで変換できました(解像度が変わるので注意が必要かも、切り出す前なので問題ないはず)。

また、上記の記事で

もう一点、VoTTが切り出したフレーム画像をそのままCreate MLで学習データとして使おうとするとトレーニング実行時にデコード失敗的なエラーが出る。

と書かれていたのですが手元の環境で試したところエラーも表示されずそのまま学習することができました(macOS 10.15.6/VoTT v2.2.0)。

Create MLで学習したモデルは下記のアプリに突っ込むだけで利用できました、最初から最後までお世話になりっぱなし。学習は画像認識(Classification)と比べるとかなり時間がかかりました。

VoTTは慣れるまでとっつきにくいのですが使いこなすと便利なツールです、ローカルでのアノテーションを行う際には利用を検討すると良いと思います。






 

この記事が気に入ったらサポートをしてみませんか?