見出し画像

Amazon Transcribe:破壊的な文字起こしのスピードと価格。 60分の音声だと150円で、20分もあれば完了。日本語にも対応。

こんにちは、Choimirai School のサンミンです。

【12月2日】運営中のサイトで韓国で発売されたTOEIC既出問題集を販売していますので、TOEICを準備されている方はぜひご検討ください。12月15日までクーポンコード(既出問題)で10% OFFとなります。

0  はじめに

機械学習を使って文字起こしを行なっているサービスはいくつかありますが、Amazon Transcribe もその一つです。11月21日から日本語も対象となりましたので、使い方を簡単に紹介します。

文字起こしの相場が1時間の音声に対して1万円前後。納期も2〜3日かかる。一方で、Amazon Transcribe を使いますと同じ長さの音声を150円で文字起こし出来ます。時間も、20分あれば十分です。

無料で利用できる枠もあって、最初の12か月間は毎月60分の音声は無料で文字起こしが出来ます。

画像1

1  Prerequisite

今回のノートは、Amazon Web Service(AWS)と AWS の S3を既に利用されている方が対象です。

AWSが初めての方は、こちらの本でクラウドサービスとは何かとAWSの特徴について理解した上で進めることをオススメします。

2  文字起こし

Amazon Transcribe の文字起こしはとても簡単です。

①音声ファイルを指定
②(任意で)音声に含まれている人数を書く
③Transcribeのジョブをサブミット

画像2

3  ジョブ作成

上記の画面から「Create transcription job」のリンクをクリックしますと、Transcriptionジョブを作る画面が表示されます。

画像3

▼必須項目

①Nameと②Language、そして③Input file location on S3を入力し、画面下にある「Create」ボタンでジョブを作ることが出来ます。

※注意:指定するS3ファイルは、Transcription Job と同じリージョンである必要があります。

任意情報

上記3つ以外にも会話に含まれている人数などニーズに合わせて他の情報も入力してください。

4  進捗を確認

「Create」ボタンを押下しますと、Transcription jobs の画面に遷移します。

画像4

ジョブ作成時に指定した、名前をクリックしますとジョブの詳細が確認できます。

長さが9分のニュースを文字起こしした結果です。1分40秒で完了したことがわかります。

画像5

5  文字起こしの精度

英語でのテストだったのですが、ほぼ完璧でした。

画像6

6  まとめ

Amazon Transcribe は使いやすいだけでなく精度も抜群です。料金も2時間の会議やインタービューでも300円で済む。本当に素晴らしいサービスです。多くの方が活用できればと願ってます。

一方で、言語に関わる仕事をされている方はこの動きに注目して欲しいです。人工知能の発達で翻訳や通訳を含め多くの仕事が自動化されると思います。猛スピードで進む変化の中でどう対応していくか、考えるべきです。

この記事が気に入ったら、サポートをしてみませんか?気軽にクリエイターを支援できます。

631
英語を学ぶから英語で学ぶを at Choimirai School。ジョージア工科大学院在籍中(専攻:機械学習)。On a mission to make English Learning more fun。

コメント4件

分かりやすい解説noteありがとうございます!
AWSの利用自体が初めてでしたが、拝読しながら日本語の文字起こしまで出来ました。
60分の音声が15分で漢字変換あり・文節単位でタイムスタンプありの完成形に感動すると同時に、この変化は本当に考えなきゃいけないことが多いですね…。
こちらこそわざわざコメントありがとうございます。S3でバスケットを作るなど初めてですとやり方が分からない場面もあったかと思いますが、早かったですね ^^。音声読み上げ機能の、Amazon Polly もぜひ試してみてください。
私は、もう85歳の老人です。英語の実力は中学生程度です。でもネットも使うしアマゾンでも物を購入しています。すごいなあ。アマゾンは。翻訳家は失業ですね。外国人もどんどん入ってくる。エライことになったで、ごわす。鹿児島の方言は翻訳できるかな?これからは方言で書きましょう?読者ゼロ?そういえば日米開戦のころ、傍受されるので方言で情報交換したそうです。?。
ライター業の一部で時々文字起こしの依頼もありますが、もう依頼なくなりますね。数年前にそういうアプリを試した時にはまだ聴き取りの精度が悪くて、会議の文字起こしなんかだと、書き起こし慣れた人間がやった方が確実だなという感触でした。 しかし精度がいいのならコレは便利。
コメントを投稿するには、 ログイン または 会員登録 をする必要があります。