凄すぎ!Gemini 1.5 Pro動画認識機能を検証!【最新LLM】
👋皆さんこんにちは!
Google AI StudioからGemini 1.5 Proの体験版にアクセスできるようになりましたので、今回は大注目の「動画認識(解析)機能」について複数の動画を使って試してみました!✨
ぜひ最後までご覧頂けたら嬉しいです!
検証用動画その①
4機の戦闘機が、編隊飛行を行っていてジェットの飛行機雲を作りながら旋回している様子の動画です。被写体が小さいため、少し難易度が高いかな?と思ったのですが結果はどうでしょうか…
回転や急降下といった動きはないのですが、それ以外は正確です!
しかもかなり詳細に動画の内容を言語化してくれました!
更にこの戦闘機の種類を聞いてみると…
実機のT-2の画像と照らし合わせてみましたが、かなり似ていました。
動画の戦闘機はおそらく後継機のT-4っぽくも見えるので、厳密には違うかもしれませんが、動画からそこまで正確に見えてるとは驚きました😮
検証用動画その②
次に、滝のアップの映像を見てもらいました。
自然の風景をどれだけ正確に捉えられるか検証したいと思います。
今回は映像の内容だけでなく、感想や印象についても生成させてみました。
いかがでしょうか。すごい精度です…😮
クローズアップから始まって上部へとパンしているなどのカメラアングルを含む時間の流れも表現できてます。「さらに、カメラは下の水たまりへとパンして戻り~」という部分はハルシネーションぽいですが、その他に関しては完璧に動画の内容を説明できていそうです。
検証用動画その③
これは以前私がスマホのカメラで撮影した八ヶ岳の赤岳山頂から撮影した日の出のタイミングの風景を撮影した動画です🌄
この動画では、手ブレなどの悪条件などがあっても正確に情景が読み取れるのか確認したいと思います。
この山が富士山ではなく、赤岳山頂から撮影されたものという指摘を行ったところ、以下のように回答を修正してくれました。
単純なAIからのフィードバックだけでなく、続けてコミュニケーションをとることで、更に多くの情報を引き出せました👍
検証用動画その④
次に、ブラウザ上で動画編集ができるツールからサンプル素材を組み合わせて前半がアニメ系の動画、後半が実写系の動画という2つの要素がある動画を作成して、内容を説明してもらいました。
アニメ系の動画でも正確に内容を理解できるのか、また二つの文脈の異なる動画があっても別ものとして理解という点を検証してきたいと思います。
👇geminiの回答
こちらもほぼ完璧に説明ができていますね!
二次元でも三次元でも、あまり認識精度に違いは無さそうです。
まとめ
Google AI StudioのGemini 1.5 Proの動画解析機能について、複数の動画を使って検証を行った結果、以下のような点が明らかになりました。
被写体が小さい戦闘機の動画でも、編隊飛行やジェットの飛行機雲など、詳細な内容を正確に言語化することができました。さらに、戦闘機の機種についても高い精度で識別できていました。
滝の自然風景の動画では、カメラアングルの変化や水の動きなどを的確に捉え、視覚的な美しさや音の特徴まで表現できていました。また、動画から受ける印象や感想も適切に生成できていました。
手ブレのある日の出の動画でも、太陽の動きや空の色の変化、周囲の山々の景色などを正確に読み取ることができました。ユーザーとのコミュニケーションを通じて、撮影場所に関する情報も修正・追加できました。
アニメと実写の2つの要素を持つ動画でも、それぞれのシーンの内容や特徴を的確に理解し、詳細に説明できていました。二次元と三次元の認識精度に大きな違いは見られませんでした。
以上の検証結果から、Gemini 1.5 Proの動画解析機能は、様々な種類の動画に対して高い理解力と表現力を持っていることが確認できました。今後の生成AIの進化の可能性を感じられますね!
まだ長い動画で語られている文脈を正確に読み取ったり、複雑な内容を解析するのはまだ難しいようで、今のところ実用性はそこまで高くないですが、Google Gemini Ultraが発表された当時のデモ動画のような、動画を解析して瞬時に内容を説明することはある程度実現されているようです。
Gemini 1.5 Proの使い方
この記事を作成している時点ではウェイトリストへの登録が必要です。
以下のGoogle AI for Developersのサイトから、ウェイトリストへの登録が可能です。メールアドレスや利用目的などを入力すると順番にアクセス権が付与されます。
最後まで読んで頂きありがとうございました!
記事をお楽しみいただけましたら是非フォローやスキをしていただけると次の投稿への励みになります!🙇♂️
■AIBridge Labについて
皆さまの温かいサポートのおかげで、活動を続けることができています。もしよろしければ、引き続き支援をお願いできますと幸いです。より質の高い記事投稿に励みます!