【ChatGPT】ついに目を開くGPTさん【GPT-4V】
動きが早いなーGPTさん。
こういう機能はタイムリーにお知らせしていきますね。
Plusユーザーに開放された新機能「画像添付と解析」を紹介します。この機能は、GPT-4Vと呼ばれています。
※GPT-4 ヴィジョン と読みます。
「ベータ機能」ではなく、GPT-4の基本機能、すなわちメインストリームで行えるようになっています。
GPT-4V(ヴィジョン)って?
GPTさんが「画像ファイル」を読み取る機能です。
従来、彼らとのコミュニケーションは「プロンプト(テキスト)」のみでしたが、これからは「画像」を使えます。目が見えるようになったんですよ。
画像認識自体は、これまでも「Advanced Data Analysis」で可能でした。今回の機能追加により「Default」から「画像」を送ることができます。
なお、画像以外のファイルは引き続きAdvancedで行いましょう。
GPT-4には強力なOCR機能があるので、画像内の文字もバッチリ認識します。つまり、文字選択を禁止しているPDFでも、Webサイトでも、コンプライアンストレーニングで出されるクイズでも。です。
あとこれ、スマホでも動きます。
いつの間にかDALL-Eも実装してた。びっくり。
できること/制限事項
新機能について尋ねてみました。あれこれ試す前にまず聞く。
回答はこちら
できること:
画像認識: 画像の内容を認識し、それに関する情報や説明を提供することができます。
アニメーションキャラクターの識別: アニメやマンガのキャラクターを認識し、そのキャラクターに関する情報を提供することができます。
図やグラフの解析: 画像に含まれる図やグラフの内容を説明することができます。
制限事項:
実在の人物の識別: 画像内の実在の人物の識別や、その人物に関する質問には答えられません。
感じ取る能力: 画像に写る実際の人物の感情や意図、心理状態などの感じ取る能力はありません。
センシティブな情報: 画像から人物のセンシティブな情報(健康状態、宗教、性格、思想、政治的見解など)を推測することはできません。
画質: 低解像度や不鮮明な画像では、正確な認識が難しい場合があります。
以上のような制限がありますので、ご理解の上、機能をお使いください。
とのことです。
使い方
いつものやつw
GPTに課金します。
メニューでGPT-4 Default を選ぶ。
画像アイコンから対象の画像ファイルを選択し、アップロード
その画像ついて聞きたいこと/してほしい処理をプロンプトで指示
クリップボードの画像もいける。すご。。。
やってみた
花道
花道の姿勢を認識しているのがわかりますね。文字は読めていない模様。
グラフ
クラフから元データのCSVを作成することもできます。
サザエさん
きちんと画像をみてキャラクターを判定しています。付帯情報はもともと知っていたのかな。
超サイヤ人
ぱっと見同じような超サイヤ人をきちんと識別しています。すごいや。
モビルスーツ
フリーダムっていうかと思ったらちゃんとわかってる。。やるな。
正解は「ガンキャノン・ディテクター」です。
アニメは得手不得手があるようですね。
人物判定
二人ほど試したところ。。
気になる答えは。。。
人を調べることは許さない姿勢が全面に!!
安全ですね。
新機能のリリースはワクワクします。
グラフを読み取ることができるのはありがたいです。
最後にちょっと試してみた。
あってるよ!でもさ、そこじゃないんだww
と思ったら。
おしまい。
この記事が気に入ったらサポートをしてみませんか?