moondreamとは
Moondream は任意の画像に対して現実世界の質問に答えることができるコンピューター ビジョンモデル。オープンソースで配信されています。
現在のモデル市場からすると非常に小さく、パラメーターは 16 億しかないとのこと。
この小ささで、携帯電話などを含むさまざまなデバイス上でローカル実行できるようになっているのが売りみたいですね。
プロジェクトページ類
🌐プロジェクトページ類はこちら。
試してみる
moondreamは超シンプルにアップロードした画像に質問してレスポンスを返してくれるようです!
早速かわいい黒猫ちゃんの画像を入れてみました!
「これは犬ですか?」とどうしようもない質問をしてみると…
普通にお返事を頂きました!
他の画像でも試してみたいと思います。
この5匹の猫の絵で試してみるとこれも真っ当な答えをくれました。
質問を変えて、どんな状況かを伺ってみると、画像の内容を話してくれました。
6匹のグループというのはちょっと惜しいな〜
でもほぼほぼ状況をそのまま解説してくれてます!
このあとは他の写真でも試してみた結果を載せておきます。
その他の検証
結構意地悪な画像でもしっかり返答してくれています!
返答もめちゃくちゃ早くて、ローカルで実行できるしセキュアでとてもいいですね🌝
chatGPT4oの場合
ちなみに2024年5月16日現在、chatGPTが4oにアップデートされ、画像の読み込みと状況の出力もできるようになりましたが、オープンソースで特化したAIというのはまたすごいアップデートを突然することもあるので今後のmoondreamの更新に期待です!!
色々便利になっていきますね!
今日はここまで〜〜