OpenAIのWhisperによる音声認識をiOS上で動かす
Whisperの推論をハイパフォーマンスにおこなう whisper.cpp は、
とAppleのハードウェアへの最適化も行われており(Accelerate framework利用)、c/c++実装をObjective-Cコードでラップする形でmacOS, iOSもサポートされている。
なおモデルはアプリ内に同梱するので、音声認識処理はオンデバイスで行われる。(Apple標準のSpeechフレームワークもオンデバイス実行は可能なので、精度や速度面での比較が気になるところだが、今回はなし)
examples配下にサンプルもあるので、ビルドして実行してみた。動作確認環境は iOS 16.3 & Xcode 14.2。
ちなみに無事日本語も使うことができた。
ビルド手順
最後まで読んでいただきありがとうございます!もし参考になる部分があれば、スキを押していただけると励みになります。 Twitterもフォローしていただけたら嬉しいです。 https://twitter.com/shu223/