【AWSTranscribe】長時間の会議議事録作成もらくらく。AWSTranscribeでカンタン文字起こし

2024年8月26日 15:25

お疲れ様です。
ファンヴォイスの須田です。

会議の録音データやインタビュー音声などを、テキストデータに変換したいけど、どうすればいいかわからない方も多いのではないでしょうか。
また、音声録音後の文字起こしも、「あの、えー」といった不要な言葉を削除したり、聞き取れない部分を書き起こしたり、いつの時代も文字起こしは結構パワーのいる作業です。

今回は、AWSのサービスを使って、誰でも簡単に音声ファイルをテキストに変換する方法についてご紹介したいと思います。

【１】準備するもの

* iPhone（または他の録音機能を持つデバイス）
* AWSアカウント
* Googleドキュメントアカウント

【２】手順

1. 音声ファイルの作成・ダウンロード
・録音： iPhoneのボイスメモなどで、変換したい音声を録音します。
・アップロード：録音した音声ファイルをパソコンにアップロードします。

2. S3へのアップロード
AWSのS3（Simple Storage Service）に、ダウンロードした音声ファイルをアップロードします。

・AWSマネジメントコンソールにログインし、S3を開きます。
・新規でパケットを作成します。
・上記で作成したパケットを選択し、「アップロード」をクリックします。
・ダウンロードした音声ファイルを選択し、アップロードします。
・アップロード完了後、ファイル名をクリックし、「S3 URI」をコピーします。

3. AWSTranscribeによる文字起こし
AWSのTranscribeを使って、音声ファイルをテキストに変換します。
・AWSマネジメントコンソールでTranscribeを開き、「トランスクリプションジョブ」を選択します。
・「ジョブを作成」をクリックし、以下の設定を行います。
   * ジョブ名: 任意の名前
   * 言語: 日本語
   * モデルタイプ: 一般的なモデル
   * 入力データ: 先ほどコピーしたS3 URIを貼り付け
   * 出力データ: サービスマネージドS3バケット
・ジョブが完了するまで待ちます。

4. Jsonファイルの変換
Transcribeで生成されたJsonファイルを、テキストに変換します。・Transcribeの完了したジョブのファイル名をクリック。
・「トランスクリプションのプレビュー」欄のダウンロードをクリック。
・下記サイトにアクセス。

・ダウンロードしたファイルを上記サイトにドラッグ＆ドロップでアップロードする。
・言語のテキスト部分のみを範囲をコピーする。

5. Googleドキュメントへの転記と修正
・Googleドキュメントで新しいドキュメントを作成します。
・コピーしたテキストを貼り付けます。
・「Ctrl+F」で不要な文字（「あの」、「えー」など）を検索し、置換します。

6. 不要なデータの削除
・S3とTranscribeで作成した不要なデータを削除します。

【３】まとめ

以上が、音声ファイルをテキストに変換する手順です。AWSのサービスを使うことで、比較的簡単に音声データをテキストデータに変換することができます。

より高度な文字起こしを行う場合は、カスタム辞書を作成したり、音声認識モデルを調整したりすることも可能です。音声認識技術は日々すごいスピードで進化しています。

また、良いアイデアがあればご紹介したいと思います。

今回も最後までお読み頂きありがとうございました。
何かのご参考になれば幸いです。

すだのぶひこ

#関連記事
【ChatGPT】ChatGPTで契約書のリーガルチェックをやってみた。

【iPhone裏技】背面タップだけで写真やスクショ出来るのが便利です。