テクノロジーを駆使した感

Open AIのwhisperとGPT4Oを使って、会議の文字起こしをした。

その前に、音声も分割しないといけなくて、そのやり方もGPT4Oが教えてくれた。
コードを書いてくれるのも、ありがたいが、環境設定も教えてくれるので本当に便利。
いつも、環境設定から苦労して、目がそうになるけど、今回は比較的それも早く解決できた方かと思う。
環境設定も億劫やけど、回数とプロンプトの精度で慣れていこうという気になった。

音声が4分割になので、四回Whisperの実行が成功すると楽しくなる。
同じデータでも、2回実行すると若干結果が違って来ることもしった。

とにかく、新しいのが実務に使えると嬉しい!

この記事が気に入ったらサポートをしてみませんか?