kaku

BizDev

kaku

BizDev

記事一覧

[Python]OpenAIの「Function calling」を使ってデータの抽出・構造化してみた

本日はOpenAI APIの新機能を活用して、ビジネスサイドの人でも役立ちそうな使い方を試してみましたので、共有してみます。 営業企画的な業務の中ではデータクレンジング、…

kaku
1年前
19

[Python]音声ファイルから無音除去、話者分離、文字起こし(WhisperAPI/Pydub/Pyannote)

はじめに先日のWhisperAPIの続きです! 本記事では以下のコードを解説しています。 音声ファイルから無音部分を除去 話者ごとに音声を分離 発話ごとに音声をテキストに…

kaku
1年前
10

[Python]OpenAIのWhisperAPIを使用して文字起こし/25MB制限対応済

はじめに普段はビジネスサイドでBizDev、なんでも屋をやっています。 Whisper使ってみたかったのでAPIに触ってみたんですが、サイズ制限とか少しつまづくことがあったので…

kaku
1年前
24
[Python]OpenAIの「Function calling」を使ってデータの抽出・構造化してみた

[Python]OpenAIの「Function calling」を使ってデータの抽出・構造化してみた

本日はOpenAI APIの新機能を活用して、ビジネスサイドの人でも役立ちそうな使い方を試してみましたので、共有してみます。

営業企画的な業務の中ではデータクレンジング、構造化作業をすることは多く、それなりに工数を払ってきましたが、8割ほどの削減になりそうな予感です。

OpenAIのFunction callingとはOpenAIのFunction callingは、自身で定義した関数に準拠し

もっとみる
[Python]音声ファイルから無音除去、話者分離、文字起こし(WhisperAPI/Pydub/Pyannote)

[Python]音声ファイルから無音除去、話者分離、文字起こし(WhisperAPI/Pydub/Pyannote)

はじめに先日のWhisperAPIの続きです!

本記事では以下のコードを解説しています。

音声ファイルから無音部分を除去

話者ごとに音声を分離

発話ごとに音声をテキストに変換

話者分離の精度はまあまあといったところですが、ChatGPTに投げて要約させる際に若干精度が上がる感じがするのと、なにより「文字起こし」らしい雰囲気が出るので好きです。

コード解説必要なライブラリのインポート

もっとみる
[Python]OpenAIのWhisperAPIを使用して文字起こし/25MB制限対応済

[Python]OpenAIのWhisperAPIを使用して文字起こし/25MB制限対応済

はじめに普段はビジネスサイドでBizDev、なんでも屋をやっています。
Whisper使ってみたかったのでAPIに触ってみたんですが、サイズ制限とか少しつまづくことがあったので共有がてら記事にしました。
ちなみに、ローカルでやれば無料なんですが、GPU使わないと結構時間かかるのに対して、APIはほんの数秒〜数分で返してもらえるので良いです(1分1円未満ですし)

OpenAIのWhisperとはO

もっとみる