Vision Kit ライブカメラで物を識別する
Vision Kitのimage_classification_camera.pyプログラムを使って、ライブカメラで物を識別してみました。
今回のnoteは、動画の続きです。
正直、識別はあまり上手ではないようです。もっと上手だったら英語の勉強にもいいんですが…。では、気付いたことを以下にまとめます。
背景が変わると識別も変わります。手に持っても識別は変化します。細長いものはsyringe率高いです。丸いとBand Aidと識別されやすくなります。
認識しにくいもの
食べ物:日本のものとアメリカのものは違うから仕方ないか~と思いつつ、玉ねぎ、にんにく、にんじん、ミニトマト、卵もきちんと識別されないのはなぜ?
エアコン:printer, photocopierと認識される。電化製品には強そうなのに、エアコンってアメリカにはあまりないんですかね。
ぬいぐるみ:ディフォルメしてあるからか、難しい動物の名前が出てくる。
口紅:細長いものはlip stickとよく認識されるので、本物の口紅で試したところ、全然認識されない。なぜ…。
認識されやすいもの
家電製品が得意?ノートPC, マウス, TVなど。
sliding door, shojiも得意。
スコアが高かったものランキング
1位:wall clock (0.99)
ライブ映像とスコアにズレがあるので、こんな写真しかありませんが…
2位:spatula (0.91)
スパチュラって言うと穴が開いていないヘラというイメージですが、フライ返しもspatulaに含まれるようです。
横向いていると認識されませんが、穴がちゃんと見えるようにすると識別率高いです。
2位:soap dispenser (0.91)
ソープディスペンサーじゃないものが、よくsoap dispenserと認識されるので、本物を試したところ、やはりスコア高し。
4位:remote control (0.89)
これもリモコンじゃないものがよくremote controlと認識されるので、本物を試したところ、やはりスコア高し。
5位:perfume (0.88)
これも(以下略)。
この記事が気に入ったらサポートをしてみませんか?