見出し画像

Microsoft Igniteシリーズ:Azure OpenaAIのGPT-4Vがやばい!

アバナード関西に所属している太田です!
日本でも大いに盛り上がりを見せているMicrosoft Igniteですが、私からはAzure OpenAIでリリースされるものを紹介していきます!

今回のIgniteでは、Azure OpenAIについては以下の情報が出ていました!

  • DALL·E 3

  • GPT-3.5 Turbo model with a 16k token prompt length and GPT-4 Turbo

  • GPT-4 Turbo with Vision (GPT-4V)

  • GPT-4 updates

  • Bing Search and Advanced Data Analytics plugins

参照元:Microsoft Ignite 2023 Book of News

私の方ではGPT-4 Turbo with Vision (GPT-4V)を紹介します!
先日のOpenAI Dev DayにてGPT-4Vがリリースされる情報が出ており、すでに話題になっていると思います!
「じゃあOpenAIで出るGPT-4Vと同じものが出るのか!」と感じる方もいらっしゃると思いますが、Azureで使えるGPT-4Vは「Azure AI Vision」と接続可能になることで、画像だけでなく、動画もプロンプトに使えるようになります!!

例えば、以下の画像のように「この広告動画を要約して」というテキストと実際の動画をプロンプトに入れることで、動画の内容を要約してくれるみたいです!!

※以下のサイトから実際に使用している動画を見ることができます!!!GPT-4 Turbo with Vision on Azure OpenAI Service (microsoft.com)

他にも以下のようにAzure OpenAIに新たな機能が出たり、Azure AI Visionの機能がGPT-4Vにより拡張されるようです!!

  • Object Grounding:Azure AI Visionで物体検出した結果をGPT-4Vが補完してテキスト応答の精度が上がるようです

  • On your data with images:Azure OpenAIで出ていたon your dataに画像が入れれます!

  • OCR:これもGPT-4Vが補完することでOCRの精度も上がるようです!!

上記のようにOpenAIよりもAzure OpenAIのGPT-4Vの方ができることがかなり増えそうですね!
今年の年末にリリースされるようなので、ぜひ使ってみたいです!!
使ったらまたブログに書きますので、こうご期待!

アバナード関西
太田 雄(Yu Ohta)

この記事が気に入ったらサポートをしてみませんか?