Gemini 1.5 Proで文字起こしを試してみた
Gemini 1.5 Proが音声ファイルにも対応したということで、Whisper大好きマンとして、どれほどのものなのかを簡単に調査したいと思います。
利用の仕方Vertex AIから利用ができました。Google AI Studioからも利用できるようです。詳細はこちら。
また今回検証する音声は以下のエネルギーに関する部分を利用します。
さっそく文字起こしを試してみるプロンプトによって出力結果に大きく影響がする感じがあります。まずは捻りのない感じでストレートなプロンプ