Amazon Transcribe:破壊的な文字起こしのスピードと価格。 60分の音声だと150円で、20分もあれば完了。日本語にも対応。
【主要なアップデート】
(2020.02.04)「7 関連ノート」のセクションを追加
(2020. 01.30)図にImageの番号を追加
こんにちは、Choimirai School のサンミンです。
0 はじめに
機械学習を使って文字起こしを行なっているサービスはいくつかありますが、Amazon Transcribe もその一つです。11月21日から日本語も対象となりましたので、使い方を簡単に紹介します。
文字起こしの相場が1時間の音声に対して1万円前後。納期も2〜3日かかる。一方で、Amazon Transcribe を使いますと同じ長さの音声を150円で文字起こし出来ます。時間も、20分あれば十分です。
無料で利用できる枠もあって、最初の12か月間は毎月60分の音声は無料で文字起こしが出来ます。
[Image 1]
Amazon からは会話やニュースキャスター風に読み上げてくれる Amazon Polly もありますのでこちらも参考にしてください。
1 Prerequisite
今回のノートは、Amazon Web Service(AWS)と AWS の S3を既に利用されている方が対象です。
AWSが初めての方は、こちらの本でクラウドサービスとは何かとAWSの特徴について理解した上で進めることをオススメします。
2 文字起こし
Amazon Transcribe の文字起こしはとても簡単です。
①音声ファイルを指定
②(任意で)音声に含まれている人数を書く
③Transcribeのジョブをサブミット
[Image 2]
3 ジョブ作成
上記の画面から「Create transcription job」のリンクをクリックしますと、Transcriptionジョブを作る画面が表示されます。
[Image 3]
▼必須項目
①Nameと②Language、そして③Input file location on S3を入力し、画面下にある「Create」ボタンでジョブを作ることが出来ます。
※注意:指定するS3ファイルは、Transcription Job と同じリージョンである必要があります。
▼任意情報
上記3つ以外にも会話に含まれている人数などニーズに合わせて他の情報も入力してください。
4 進捗を確認
「Create」ボタンを押下しますと、Transcription jobs の画面に遷移します。
[Image 4]
ジョブ作成時に指定した、名前をクリックしますとジョブの詳細が確認できます。
長さが9分のニュースを文字起こしした結果です。1分40秒で完了したことがわかります。
[Image 5]
5 文字起こしの精度
英語でのテストだったのですが、ほぼ完璧でした。
[Image 6]
6 まとめ
Amazon Transcribe は使いやすいだけでなく精度も抜群です。料金も2時間の会議やインタービューでも300円で済む。本当に素晴らしいサービスです。多くの方が活用できればと願ってます。
一方で、言語に関わる仕事をされている方はこの動きに注目して欲しいです。人工知能の発達で翻訳や通訳を含め多くの仕事が自動化されると思います。猛スピードで進む変化の中でどう対応していくか、考えるべきです。
7 関連ノート
こーたろーさんが30分の社員インタビューをAmazon Transcribeで文字起こしした結果をまとめてくださったノートです。併せて、参考にしてください。