油性がMYCOEIROINK制作について知ってること、やってることを雑に書き出したよ。
別に合成音声の技術とか詳しい訳では無いので、普通に間違ってる可能性あるからその時は許してくれ。
★収録数
コーパスの読みやすさ諸々の優先順位
MANA>EMOTION>RECITATION
・MANAは全体的に短く普通の文が多くて読みやすいです。会話文も多いのでキャラクターを作りたい場合は優先して読むと良いです。
・EMOTIONは一部の文章が長くてつらいです。無理だったら読まなくてokです。
・RECITATIONは、EMOTIONを読んで「文章読むのつらい!くるしい!」となった人は読まなくていいです。
★学習の回し方
・つよつよグラボ持ってる人向け
100エポックまでの日数:グラボによる
今のcolabは本当に学習が進まないのでつよつよグラボ持ってる人はローカル学習の方が圧倒的に早いよ。
ただグラボがなんかすごい消耗されるらしいので自己責任で。
やり方は調べりゃ出てきます。出てこなかったらごめん。
・面倒臭がり向け
100エポックまでの日数:2ヶ月程度
colabで回す場合、最初の方は毎日5~8エポック程度進むのですが、日に日に進まなくなります。
その為、最初の内は毎日回して、1~2エポックしか進まなくなったら1日置いて学習、とやっていきます。
ただ、それでも「1日1エポック」みたいになるので、最終的には1週間に1回くらいでいいんじゃないすかね。
課金した場合も初日は60エポックほど進みますが次の日からは上と同じやり方になります。
・無課金で早く作りたい人向け
100エポックまでの日数:やる気とアカウント数による
「1つのアカウントで限界まで学習した後、別のアカウントにデータを持っていって限界まで学習」を限界までやります。
作業フォルダを共有すると毎回データ引越ししなくてもできるらしいんですが、よくわかんにゃいのとBANの危険性があるかもしれないとの事なので説明は控えます。
★ベースモデルの選び方
model1 つくよみちゃん 女性はこれ選んどきゃだいたい正解です。
model2 おふとんP 男性はこれ選んどきゃだいたい正解です。女性でもG3以下が出ていれば、要するに低い声ならこちらを選んだ方がいいです。
model3 MANA 「俺はロリだぞ」という人は。
女性がmodel2にすると音声がガビりがちです。(ただ公式だとmodel2が勧められてるので学習の初期段階だけの可能性はあるかも)
男性がmodel1、3を選んだ場合も同様。
★特に来てないQ&Aのコーナー
Q.いっぱい読んだ方がいいんですよね?
A.読むのたのしー!って思ったならいっぱい読んだらいいと思うよ。滑舌に自信がないなら多く読むほど滑舌が悪くなっちゃう可能性もあります。人によるのでトライアンドエラーで。
Q.100エポックまで回さなきゃいけないんですか?
A.「なんかもういい感じじゃん」って思ったならそこでやめてもいいと思うよ。
Q.学習後にコーパスの読み間違いを発見した!
A.やり直したりせずそのままzipを修正した方と入れ変えた後に、学習回すと直るらしいよ。作成ノートのバージョンアップなどで変わってる可能性がありますが…。
Q.ファイル数によって学習の早さは変わる?
A.体感変わらないです。
Q.なんかノートで英語のエラー出た
A.基本的に想定されているエラーの場合は日本語で表示されます。
ぼすきーとかdiscordのCOEIROINKを使いたい鯖で投稿するとたぶん誰か反応してくれるからスクショつけて聞いてみるのが早いです。
まあだいたい「必要データのDL」の押し忘れであることが多い気がします。
日を開けると直ったりする時もあったりします。
Q.いちいちポチポチするの面倒なんだけど!
A.1回目の学習はポチポチするしか無いですが、2回目からは上のバーの「ランタイム」から「すべてのセルを実行」で勝手にやってくれます。ベースモデルの変更は先にしといてください。
この記事が気に入ったらサポートをしてみませんか?