見出し画像

🎶SSMLとJSMLの違い 音声合成

いきなりエクスキューズ

SSMLは、サン・マイクロシステムズ社が開発したJava Speech Markup Language (JSML)をベースにしていますが、現在の勧告は音声合成ベンダーが中心となって開発したものです。SSMLは、合成に関するほぼすべての側面をカバーしていますが、一部の領域は指定されていないため、各ベンダーは異なる言語のバリエーションを受け入れています。また、マークアップがない場合、合成機はテキストの解釈を独自に行うことが期待されています。ですから,SSML は C や HTML のような厳密な標準ではありません.

もともとJSML(JSpeech Markup Language)は、音声合成装置に入力されるテキストに注釈を付けるための、非常にシンプルなXMLフォーマットとして開発されました。JSMLの特徴はSSMLとよく似ていて、文書の構造を記述する要素を定義したり、単語やフレーズの発音を提供したり、フレージングや強調、ピッチや話す速度を指示したり、その他の重要な音声特性を制御したりしていました。マークアップ言語名の "J "は、サンが音声技術のリーディングカンパニーと共同で開発したJava(TM)Speech APIに由来しており、Java技術をベースにしたアプレットやアプリケーションのユーザーインターフェースに音声技術を組み込むためのものです。JSML要素の設計とそのセマンティクスは非常にシンプルです。

SSMLは、W3Cのオープンプロセスによって開発された、音声ブラウザ用のマークアップ仕様の一部です。SSML は、ウェブやその他のアプリケーションで合成音声の生成を支援するための、XML ベースの豊富なマークアップ言語を提供することを目的としています。このマークアップ言語の重要な役割は、合成可能なコンテンツの作者に、異なる合成可能なプラットフォーム間で、発音、音量、ピッチ、速度などの音声出力の側面を制御する標準的な方法を提供することです。テキスト入力をマークアップするための標準的なシステムを確立するための関連する取り組みとして、SABLE [SABLE]があります。これは、音声合成のための多くの異なるXMLベースのマークアップを新しいものに統合しようとしたものです。SABLEで行われた活動は、音声合成マークアップ言語のための音声合成マークアップ要件[REQS]を定義するための主な出発点としても使用されました。それ以降、SABLE自体の開発は行われていません。

https://en.wikipedia.org/wiki/SABLE


お願い致します