見出し画像

Vision Kit ライブカメラで物を識別する

Vision Kitのimage_classification_camera.pyプログラムを使って、ライブカメラで物を識別してみました。

今回のnoteは、動画の続きです。

正直、識別はあまり上手ではないようです。もっと上手だったら英語の勉強にもいいんですが…。では、気付いたことを以下にまとめます。


背景が変わると識別も変わります。手に持っても識別は変化します。細長いものはsyringe率高いです。丸いとBand Aidと識別されやすくなります。

フォーク
ナイフ
金尺
にんにくもsyringeなのはどうなんだろう…
じゃがいも


認識しにくいもの

食べ物:日本のものとアメリカのものは違うから仕方ないか~と思いつつ、玉ねぎ、にんにく、にんじん、ミニトマト、卵もきちんと識別されないのはなぜ?

玉ねぎ

エアコン:printer, photocopierと認識される。電化製品には強そうなのに、エアコンってアメリカにはあまりないんですかね。

エアコン

ぬいぐるみ:ディフォルメしてあるからか、難しい動物の名前が出てくる。

口紅:細長いものはlip stickとよく認識されるので、本物の口紅で試したところ、全然認識されない。なぜ…。

認識されやすいもの


家電製品が得意?ノートPC, マウス, TVなど。

sliding door, shojiも得意。

スコアが高かったものランキング

1位:wall clock (0.99)

時計

ライブ映像とスコアにズレがあるので、こんな写真しかありませんが…

2位:spatula (0.91)

フライ返し

スパチュラって言うと穴が開いていないヘラというイメージですが、フライ返しもspatulaに含まれるようです。
横向いていると認識されませんが、穴がちゃんと見えるようにすると識別率高いです。

2位:soap dispenser (0.91)

ソープディスペンサー

ソープディスペンサーじゃないものが、よくsoap dispenserと認識されるので、本物を試したところ、やはりスコア高し。

4位:remote control (0.89)

リモコン

これもリモコンじゃないものがよくremote controlと認識されるので、本物を試したところ、やはりスコア高し。

5位:perfume (0.88)

香水

これも(以下略)。

この記事が気に入ったらサポートをしてみませんか?