ChatGPTとの連携を考えてみる③
はじめに昨年11月のOpenAI DevDayにて、前回投稿したCode Interpriterも本家API(Assistant API)のみで利用できるようになるなど、ChatGPTの機能追加が連打されました。中でもGPT-4 with vision(以降「GPT-4V」)は、遂に画像の認識も可能となり、いよいよマルチモーダルの本領が表れたと言えます。
一方、後を追うように、Googleも12月にGemini(画像認識可)を発表し、熾烈な追い上げを見せています。LLaVa