![見出し画像](https://assets.st-note.com/production/uploads/images/117213728/rectangle_large_type_2_e629882737192aafd35c08970d1c3c63.jpeg?width=800)
ChatGPTに画像を認識させる
これは、2023年6月頃の記事です。その後、ChatGPTの本体に画像を受け取る方法が追加になり、使い易さが一段とアップしました。ここで紹介する方法は、プラグインを介したもので、引き続き有効です。
準備:
1. GPT4プラグインの SceneXplain を有効化する
2. 画像の url をプロンプトに記述して与える。
![](https://assets.st-note.com/img/1695659601079-KZ4eB4FT8I.jpg?width=800)
例えば、「ロボットの横に女の子が座っている画像」をChatGPTにurlで与えたところ、これを次のように分析した。
この画像は、未来的な設定で、様々な興味を持つキャラクターたちが集まる、居心地の良いハイテクな作業スペースを中心に描かれています。
若い女の子がシックな木製のデスクに座り、タブレット画面の上に重なるチェス盤でゲームに集中しています。彼女の注意は、ゲームと彼女を囲む鮮やかなポスターやディスプレイ、装飾品のコレクションとの間で揺れています。
彼女の隣には、コンピュータを操作する助けになるロボットの仲間が座っています。先進的なテクノロジーを手に入れた部屋の住人たちは、各々が自分の情熱を追求しながら、マルチタスクをこなし、学んでいます。//
ChatGPTに与えたのは画像だけで、例えば「ゲーム」「ロボット」などの文字情報は一切与えていない。にもかかわらずChatGPTが画像の細部を認識し、加えて人物の心理まで描写しようと試みている点は注目に値する。
この記事が気に入ったらサポートをしてみませんか?