OpenAIの文字起こしWhisper。試したらすごかった。
どれくらいの精度かを、皆さんにも味わってほしいので、以下事例。
6分半の音声(約6.5Mbyte)を、Whisperに投げる。1分弱で処理が終わる。
audio_file= open("/mp3/パリルーベ2023.mp3", "rb")transcript = openai.Audio.transcribe("whisper-1", audio_file)print(transcript["text"])
対象はこちらの動画
結果はこちら。95%は正しい。
※おかし