見出し画像

CoeFont CLOUDで自分の合成音声を作る

自分の声で自動的にナレーションが作れたら

面白いと思いませんか?

自分ひとりで行う声の収録・編集

思ったよりも10倍ぐらい骨が折れる作業です。

まず静かな環境づくり、それから機材や声の調子を整えて録音。

ノイズや尺の編集にも多くの時間が取られます。

そんな諸々の問題を解決してくれるサービスが

CoeFont CLOUD

原稿さえあれば、収録や編集の工数が大幅に省けます。

つい先日、株式会社Yellstonが、

AI音声合成プラットフォーム「CoeFont CLOUD

をリリースしました。

私は自分の発音に課題があることを認識しながらも

「これは是非使ってみたいな〜」と思い

マイボイス・パイロット版づくりに挑戦してみました。

今日はその準備と完成品の紹介記事です。

所要時間・費用

今回、ミドルレンジというプランを使いました。

ミドルレンジの収録時間は約60分。

私の場合、まったくの素人のため

文章1個あたりの読み上げに2〜3回撮り直しが必要でした。

文章の例としてはこんな感じ。

CoeFont作成___CoeFont_CLOUD-6

取り直しの影響で予定の2倍、2時間かかりました。

原稿を間違えずに読むのがまぁ難しいです。

途中、滑舌上どうしても読めない原稿がありました。

かかった費用は1,000円ポッキリ。

これは安いです。

CoeFont CLOUD利用規約に目を通しておくことも大切。


CoeFont CLOUDには、登録した声を利用してもらうと

登録者に収益が入る仕組みがあります。

たとえば1文字あたり10ptと設定した場合、

1000文字使用されると42円の収入が入るようになっています。

15ptなら1000文字で77円、

20ptなら1000文字で112円となります。

自分自身でCoeFontを使用する場合は

 1文字あたり5 ptのみ消費され

自身で利用したポイントは収益に還元されないという仕組み。

収録の準備

今週は比較的体力が余っていたため収録が可能でした。

疲れていたら気力的にこんな収録はできない。

・・ミドルレンジに挑戦するなら体力温存を。

ローエンドプランなら仕事のあった日の夜でも

パパッと出来るかもしれません。

とにかく静かな室内環境が重要です。

今は夏なので予め部屋をクーラーで冷やしておいて、

録音の時はクーラーOFF。

余分な雑音がないように気をつけました。

我が家には宅録環境がほんの少しだけ整っています。

YetiのコンデンサーマイクをPCに直接繋げて録音しました。

少しだけ吸音設備も使っています。

収録途中でPCが熱くなり、ファンが回り始めたのはちょっと失敗。

ノートPCなので仕方ありません。

途中でお腹が鳴ってしまったし、声はかすれ気味になりました。。

いつも同じコンディションに整えている声優さんはスゴイ。

一定の速度で読むのも結構難しかった。

原稿にそれぞれ工夫があり

読むことは飽きずに続けられました。

2日間に分けて録音したので、

やや声の大きさが変わってしまった可能性がある。

できるだけ連続で収録できる計画を。

このようなコンデンサーマイクがあると

声を綺麗に拾ってくれます。

録音前に確認すること

★機材・環境
 マイクの準備
 ノイズのない環境
 途中で収録環境を変えない
★読み方
 一定のスピードで読む
 読点の位置に注意して読む

CoeFont作成___CoeFont_CLOUD

収録プランに申し込んだ後、

すべての読み原稿がダウンロードできます。

あらかじめ口の体操全身のストレッチ

原稿読み練習をした方が良いかなと思います。

良い声は良い身体から。

ミドルレンジの場合、400個の文章をひたすら読みます。

自分の声やイントネーションを機械学習させるんですね。

簡単な手順は次のとおり。

1)自分で録音開始ボタンを押す
2)1つの原稿(文章)を読む
3)自分で録音停止ボタンを押す
4)再生する ※再生しなくても進めることは可能
5)必要に応じて再収録
  ※1つ前の原稿に戻ることはできますが、
   後からまとめて収録し直すことはできません
6)「ヨシ!」と思ったら次の原稿に進む
  ※途中で保存して休憩可

最初の100個ぐらいはとにかく間違えまくりでしたが

緩急ある文章だったので最後まで根気よく収録できました。

原稿をすべて読み終えるとこんな画面が出てきます。

CoeFont作成___CoeFont_CLOUD

14:30頃終えて深夜0:00すぎに完成のメール連絡が入りました。

約10時間ほどで自分のCoeFontが出来上がったということです。

ファンなどの環境音もシステムでチェックして消していますから、あまりその辺を神経質に考えていただかなくても大丈夫です。500円で自分の声を深層学習させ、自在に音声合成を可能に。(19歳大学生社長が開発したCoeFont CLOUDの破壊力  より)

私の場合、特に「き」と「け」が

うまく発音できないのですが

収録音声を何度か再生してみたところ

さ行た行の滑舌も良くないかも、と

気づかされました。

仕事上、声を出す機会は少なくないものの

加齢やマスクによって口の動きが小さくなった影響で

滑舌が悪くなっているかもしれません。

口の機能低下について

自分の滑舌に反省したところで

せっかくなので口腔機能について

少しご紹介しておきたいと思います。

口腔機能が低下する、すなわち口が弱ること

オーラルフレイルと呼びます。

オーラルフレイルとは、噛んだり、飲み込んだり、話したりするための口腔機能が衰えることを指し、早期の重要な老化のサインとされています。噛む力や舌の動きの悪化が食生活に支障を及ぼしたり、滑舌が悪くなることで人や社会との関わりの減少を招いたりすることから、全体的なフレイル進行の前兆となり、深い関係性が指摘されています。日本歯科医師会HPより

口が弱ることは身体の衰えだけでなく

社会性の低下とも関連があるんですね。

口の健康が全身の健康につながることは

様々な研究で明らかにされています。

お年寄りがお茶を飲んでむせる場面を

見たことがあるかもしれません。

むせもオーラルフレイルの可能性が否めません。

誤嚥性肺炎(ごえんせいはいえん)も

オーラルフレイルと密接な関係があります。

オーラルフレイルとは

私が関わるのは、口腔機能訓練という口のリハビリで

高齢者に個別で口腔清掃の指導や

摂食・嚥下機能に関するリハビリを行います。

摂食(せっしょく)とは食べること、

嚥下(えんげ)とは口の中のものを飲み込むことです。

皆さんのご両親の口の状態はいかがですか?

口や歯の状態が悪くなると柔らかいものを好んで食べ、

結果的に栄養状態が悪くなることが多々あります。

栄養状態が悪くなると体力が落ち、

ますます動かなくなって弱っていくのですね。

もしご心配があるようならケアマネさんに

「口腔機能訓練はリハビリで可能ですか?」

と相談してみてください。

口や身体の衰えは予防すること、

進行を遅くすることが可能です。

「お口の健康」からはじめるフレイル予防

皆さん自身も若いうちから定期的に、

少なくとも1年に1回は

歯医者さんで口や歯の状態をチェックしておくことをお勧めします。

将来、口を健康な状態に保ちきちんと歯を残すこと

健康長寿の秘訣だからです。

fm23のAI合成音声

こちらからどうぞ↓

セリフ、ニュース、小説でお試し再生ができます。

個人的お気に入りは小説バージョンです。

濁る部分は少しロボット要素が残りますが、

充分に私が再現されています。

アレクサやSiriの声を誰かの声に設定できる日も

そう遠くはないのかも。

自分で自分の声を利用する場合は

別途プラン加入が求められます。

↓こちらが利用プラン。

あくまで感覚的な意見ですが、小学3年生ぐらいから

自分で画面操作して収録することが

可能になるのではないでしょうか。

--

今日のサムネイルはShigureniさんの

イラストを使わせていただきました。

どうもありがとうございました。


この記事が参加している募集

買ってよかったもの

私の作品紹介

読んで下さりありがとうございます。読みやすいコラムを目指します。