任意の画像に対する質問になんでも答えてくれるミニマムオープンソースAIツール「moondream」を試してみる
moondreamとはMoondream は任意の画像に対して現実世界の質問に答えることができるコンピューター ビジョンモデル。オープンソースで配信されています。
現在のモデル市場からすると非常に小さく、パラメーターは 16 億しかないとのこと。
この小ささで、携帯電話などを含むさまざまなデバイス上でローカル実行できるようになっているのが売りみたいですね。
プロジェクトページ類🌐プロジェクトページ類はこちら。
試してみるmoondreamは超シンプルにアップロードした画像