ChatdollKit が v0.7.4 にアップデートし、GPT-4o のビジョン機能等によってカメラ映像や画像ファイルの認識・分析ができるようにななりました。
それで、スマホ版「AIしげちゃん」も ChatdollKit v0.7.4 ベースに乗せ換えて、UIまわりをカスタマイズ。
スマートフォンのカメラで「AIしげちゃん」に映像を見せて、その内容をもとにテキストや音声で会話をすることができるようになりました。
これで、「AIしげちゃん」も目が見えるようになりましたねw
見えるだけではなくて、物の数を数えたり 文字を読み取ったり、数式を見せて計算させるようなこともできます。
また、従来通り、Function Callingによって、仕事場部屋に置いてある環境センサーの温湿度の値や不快指数を答えたり、スマートリモコンと連携して部屋の照明や家電製品を制御したりすることもできます。
また、今のところ、プロンプトは以下のようになっています。まあ、キャラクター設定以外はChatdollKitで示されているものと同じですが。