Whisper(v3, distil)やVoskを超簡単に試せるデスクトップアプリ爆誕!
音声認識まわりで有名なWhisper(v3, distil)やVoskを活用し、リアルタイムな文字起こしアプリケーションを作ってみました!
OpenAI社のAPIも使えるので、高速な文字起こしに加え、AIとのチャット体験も可能です。
背景AIがどんどん進歩していく中、OSSでこんなことまでできるんだ!という身近な体験を作りたいと考えたときに、まずは音声認識かなと思ったのが開発のキッカケです。調べていくとPythonを使ったスクリプトベースの事例は多くありましたが、アプリケー