見出し画像

[Whisper] API経由の文字起こしツール『Snackゐsper』を作っています

こんにちは、キン担ラボの本橋です。

本橋です

前回のnoteでWhisperAPIを使った文字起こしツールはいくつかあると思うのでお好みのものを選んで下さい、というお話を書きました。

絶対あるだろうと思っていましたが、ちょっと検索してみた限りWhisperAPIに特化したツールがどうやら無いみたいですね。

他にも使いたい方がいるかもしれないので、公開する方向で開発しています。とはいえまだ開発環境でしか動作できておらず、インストール手順など整いましたらこちらでお知らせしたいと思います。

極力シンプルにしたい

ローカルGPUを使うアプリはあります

ローカルでGPUを使ってWhisperモデルを動かすアプリであれば、うみゆきさんのMyWhisperを始めいくつかあるようです。

ところがネット越しにWhisperAPIを呼び出して動作する単独のGUIアプリは見つけることができませんでした。

もっと探せばあるのかもしれません。こんなのあるよー、とご存じの方はよかったら教えていただけると嬉しいです❗

API経由はお金がかかる?

API経由でWhisperを使うためにはOpenAIのAPI利用手続き必要です。実行は破格とは言え、それでも1時間ごとに50円くらいの利用料金が発生します。あんまり需要もないのかもしれません。(でもこれ、めっちゃ安いんですよ)

僕自身はノートパソコンを持ち歩いて仕事をしている事もあって有料でも外部のコンピューターリソースが使えるなら使おうという方針です。WhisperAPI経由の文字起こしも僕にとっては使い勝手の良いものでした。

まだ自分の環境でしか動いていないとは言えとっても便利です。それに文字起こしとChatGPTを連携させると効果絶大で、使い方もまだまだ色々書きたいことがあります。

kintoneはどうした?

kintoneのコンパニオンアプリを作りたいなーと思って調べていて、ひとまずGUIの勉強がてら手元のツールをアプリ化してみるか、と作ってみた試作品が今回のSnackゐsperでした。

kintoneもデスクトップアプリと連携できると使える場面を増やせます。異種拡張技の延長と思ってください。


この記事が気に入ったらサポートをしてみませんか?