見出し画像

ゆるプロ!番外編「Whisperで音声認識して翻訳してもらう」

ゆるいプログラミング講座、略して「ゆるプロ!」
これは気軽に気楽に試せるゆるーいプログラミング学習コンテンツである。今回のお題は「Whisperで音声認識して翻訳してもらう」


一言)

前回の記事より、音声認識したファイルを翻訳してもらった。Whisperには翻訳機能もあるので実行した

飯坂温泉は、大湯、東北、地方有数の固湯であり、 古くはサバコの湯と呼ばれました。

例)Whisperで音声認識して翻訳してもらう

import whisper
model = whisper.load_model("medium")
result = model.transcribe("rec.m4a", fp16=False, language="ja",task="translate")
print(result["text"])

結果)

 Iizaka Onsen is a very rich and rich lake in the northeastern part of the Ouu River. It was called the Sabako-no-yu in the old days.

bing翻訳にかけるとこんな感じ。流石に音声認識の段階で出来上がったテキストに依存はしたが、通じなくはないと思う。

飯坂温泉は奥羽川の北東部にあるとても豊かで豊かな湖です。昔はサバコの湯と呼ばれていました。

https://www.bing.com/translator?to=ja&setlang=ja

参考)

OpenAI Whisper Github

参考にしたブログ

おわり!