見出し画像

リアルタイムで自動文字起こし(1@AToolsSRTPlayer)

自動字幕再生ソフト製品版をリリースしました。

動画または音声から自動で字幕ファイルを作成する自動文字起こし再生ソフト(Authoring Tool Featuring SubRip Text Player)です。
※本ツールは、動画または音声から自動で字幕ファイルを作成する自動文字起こしソフト『AToolsSRT』の姉妹製品で、このプレイヤーでは自動文字起こしの再生をリアルタイムにできます。
「マイク」または「ステレオミキサー」にも対応しています。

『AToolsSRT』は、高精度でエンコードしたい人向け。
『AToolsSRTPlayer』は、リアルタイム性を重視するライブ配信向け。
となっています。

【主な機能】
※自動で字幕ファイルを作成して再生します。

※動画編集の文字起こし作業を軽減できます。

※オンライン教材等の文字起こし作業を軽減できます。

※動画の音声をミュートにしないといけない静かな環境でも、視聴する動画の理解を助けます。

※音声を視認化することで、難聴等の障害をもつ方などへの配慮した動画や、聴講を手助けすることができます。

※オフラインで文字起こしするので、セキュリティ面で安全にご使用していただけます(speech to text on the offline)。

※スキンを変更できます(「オリジナル」背景または「フレーム」背景に対応しています)。

※「マイク」「ステレオミキサー」「動画」または「ストリーミング動画」(「高画質」URLまたは「低画質」URLを自動解析付き)に対応しています。

※音声認識のサポート言語を変更できます(「英語(English)」または「日本語(Japanese)」に対応しています。※「英語(English)」は別途追加パックが必要))。
(※他に、「中国語(Chinese)」「フランス語(French)」「ドイツ語(German)」「イタリア語(Italian)」「ロシア語(Russian)」にも応相談)。

※映像ファイルは、様々な映像効果(音声平均化等)の切り替えが利用可能です。

※音楽ファイルを再生します。

※音声には、マルチトラックに対応しており、切り替えが利用可能です。

※生成された字幕ファイルは、字幕ファイルの読み込みに対応した動画再生ソフト(MPC-classic, vlc等)で利用可能です。

≪注意!!≫変換処理時に、聞き取りにくい音声があった場合には正常に変換できませんのでご注意ください。

【簡易説明】
・「マイク」「ステレオミキサー」を文字起こしするには、スキンを「フレーム」背景へ変更して、開始してください。
・「ストリーミング動画」を文字起こしするには、スキンを「オリジナル」背景または「フレーム」背景へ変更して、開始してください。
※入力デバイスとして「マイク」「ステレオミキサー」または「音声」を文字起こしする際、スキンに「オリジナル」背景を指定されていた場合は、「フレーム」背景へ自動で変更して、開始されます。
※入力デバイスとして「音声」を文字起こしする場合は、(*.mp3, *.aac)に対応しています。
・「ストリーミング動画」を文字起こしした際、プレビュー時にラグが発生するときは、ストリーミング動画の画質を落とすことで改善されます。(将来PC性能が向上することで緩和されます)
・入力ファイルの画質には上限を設けていませんが、推奨はFHDまでとしています。
※4K以上はそれなりのスペックが必要です。FHDの場合は4GBメモリー、HDの場合は3GBメモリーが必須となります。

【サンプル動画】
サンプル動画をアップしました。twitterに載せてあります。
※サンプル動画では若干画質を落としてあります。

https://twitter.com/ATools6/status/1530386102376595456

【再生方法】
文字起こしは、たったの1ステップのみで行なえます。

【推奨環境】

・対応OS:Windows7 64bit以降
・プロセッサ:Intel 2GHz以上
・メモリー(RAM):4GB以上


--
厚意で皆さんへ期間限定(終了時期は未定)で公開します。
自動字幕再生ソフトの無償体験版は、こちらからダウンロードできます。

https://osdn.net/users/szz67166/pf/AToolsSRTPlayer_Demo/files/?id=38449

《製品版と体験版との主な違い》

【製品版】
・スキン(「オリジナル」背景または「フレーム」背景)に対応
・音声認識のサポート言語(「英語(English)」または「日本語(Japanese)」)に対応
※他に、「中国語(Chinese)」「フランス語(French)」「ドイツ語(German)」「イタリア語(Italian)」「ロシア語(Russian)」にも応相談

【体験版】
・スキン(「フレーム」背景)に対応
・音声認識のサポート言語(「英語(English)」)に対応
・ロゴ


---
制作秘話 ―
ライブ配信やネットラジオなどの配信番組の個人的な視聴方法として、静かな部屋で何かを作業中、"映像"を観るのではなく"音声"をミュートにして"映像"のみを見ていることも。でも"音声"なしだと内容が伝わりにくい…。
そんなときにどんな映像であっても音声を視認化できれば何かすごくハッピーになれるかなと思ったのがきっかけで本ソフトの制作を開始しました。
当初は音声認識におけるdeep-learningの特性上、文字起こしの精度や処理速度や容量の大きさ、この他、音声認識開発の言語モデルの調整や配布時の問題が多々あったため、
リアルタイムで文字起こしできる本ソフトの開発を一時保留していたのですが、音声認識分野における近年の飛躍的な向上を鑑み、本ソフトの制作を近年再開 ― そして完成できました。

ひっそりとここで様々なソフトを公開してきましたが、見つけて使っていただいている方もいるみたいで励みになりました。
今回、体験版を配布するにあたっては悩みましたが、音声認識開発の発展を促進すべく、終了時期未定で期間限定公開することにしました。
※ただし、皆さんから寄付等の応援がないと開発を継続することは困難であるため、早めに公開終了する可能性もございます。ご了承ください。

なので、まだまだ盛り込みたいアイディアが頭の中にはありますが、当初の真の目標は達成できたのと、諸事情により、本ソフトの開発は一旦終了したいと考えています(マイナーアップデートは継続)。

今後について ―
作り終えて、使ってみると新たな発見があるもので、今回のソフトについていえば、英語は読めば理解できてもネイティブ発音は理解できない私にとって、文字起こしの補助があると非常に助かったという話です。
海外の配信も楽しく観れるようになり、語学の勉強にもなるため、今後は手放せないソフトになりそうです。

次は、何に挑戦しようかな…。

--
本ソフトは、現在、有償と無償でのご提供とさせていただいております。
無償は体験版をご提供させていただいております。
お問い合わせは、コメントまたはDMにて。

#AToolsSRT #AToolsSRTPlayer #文字起こし #音声認識 #オフライン #再生ソフト




この記事が気に入ったらサポートをしてみませんか?