マガジンのカバー画像

LLMの活用

44
運営しているクリエイター

#文字起こし

YouTubeの英語音声をfaster-whisperとLangChainですばやく要約してみる

whisperによる文字起こしについては高速に文字起こしができるようになったとのこと。というわけで、WhisperとLangChainを組み合わせて長時間の音声の要約に取り組んでみました。 音声ファイルの準備ダウンローダーのインストール !pip install yt-dlp 音声ファイルのダウンロード !yt-dlp -x --audio-format mp3 https://youtu.be/35pSeFWWatk -o bard.mp3 Google I/O

2時間のYoutube音声を自動で要約 ~ NVIDIAのCOMPUTEX 2023基調講演

先日のNVIDIAのCOMPUTEX 2023でのジェンスン・ファンさんの基調講演を題材に、Youtube音声の要約課題に再トライしてみました。 音声をダウンロードトータル時間:1時間55分57秒 実行時間:2秒 !yt-dlp -x --audio-format mp3 https://youtu.be/i-wpzS9ZsCs -o nvidia2023.mp3 文字起こし時に長いと、なぜか止まってしまうので適当な時間に分割します。 実行時間:1秒 !ffmpeg