見出し画像

音楽生成AIでBGMを量産する

Udioさんが長尺の音楽生成に対応して、一発で2分10秒のクリップを生成できるようになった。
で、考えてみたのが同人ゲームのBGMならこれで賄えるんじゃないかなと。
フリー素材のサイトを漁って色々ごっちゃで使うよりも、形式や音質が統一されてて使い勝手が良いような気がしたので試してみた。

使用条件とか(追記)

書き忘れてたので追記。

Udioの規定では生成した曲は商用利用可。
うちがここで公開してる奴も自由に使ってくれてOKっす。
ただ、DLsiteで「一部AI生成使用」の分類になったりするから注意。

まとめてダウンロードできるようにしました。

とりあえず聞いてみて

なんとなく系統別にプレイリスト化したんで好みのを聞いてみて。
(10ドル課金、丸2日かけて好きなジャンルを量産してみた)

エモいの

熱いの

ケルト風

和風テイスト

評価

ループ処理してあげれば概ね使えそう?
ただ、ぶっちゃけ同人ゲームのBGMとしては、ちょいオーバースペックというか……(インディーズゲームじゃなくて、同人のエロRPGとかを想定してたので)

コストについて(追記)

歩留まり

今回、自分の基準で使えそうだと判断したのが約50曲。
生成数が250曲なので、2割くらいは採用できてる感じです。
(レベル感は聞いてみて判断してください)

没にした曲についても品質が低いわけではなく、用途に対して曲調が合ってないとか、そういう感じのNGが多いです。
曲調はすごくブレる。

料金

Udioは1ヶ月のサブスクが $10 USDです。
それで月に1200クレジットが付与されます。
今回の試みでは500クレジット消費したので、だいたい700円分くらいですね。
1生成で4クレジット消費、2曲が同時に生成される仕組みです。

時間

音楽の場合こっちが問題っすね。
絵とかに比べて検品コストがかかるというか……
再生時間分は人が拘束されるので、そこは覚悟してください。

生成のコツとか

同じ事を考えてる人の為にナレッジ残しときやす。

設定

まずは設定画面から。

udio-130が増えた

「Suggestions」は「Manual Mode」固定で。そうしないと勝手にプロンプト増やされる。
「Model」は「udio-130」で2:10生成を。これは有料オプションなんだけど、これじゃないと一発で使えるサイズのは出ない。無料プランでも回数限定で使える。(確か3回くらい)
「Prompt Strength」は気分次第。どうせ100%まで上げたってそこそこの頻度で別物が出てくる。うちは80%位まで上げてる。
「Clarity」はデフォルト25%だけど、30~40%くらいまで上げてる。これも気分。正直ランダム要素が強すぎてあまり効果を体感できない。
あと、「Geberation Quality」は「Ultra」までガッツリ上げる。生成時間は長くなるんだけど、まぁ放置しとけばいいので。

プロンプト

めっちゃ独断と偏見による体感のメモ。
生成結果はすごくブレるので、

「film score」
映画の劇伴っぽいのになる。スポット用途な構成になりがちというか、ゲーム用途としてループで流す感じのからは離れがち。

「game music」
MIDI音源感というか打ち込みっぽさが出やすい。稀にチップチューンなのも混じる。楽器構成はあまり安定しない。

「anime music」
今風のゲームBGMを目指すなら実はこっちが丁度良い。
生成される曲がライトリスニング寄りに安定する。(気がする)

「fast track」「uptempo」
疾走感でる。突っ走れ!

「uplifting」「passionate」
高揚感でる、熱くなる。バトル系のBGMにはとりあえず入れとくべし。

「progressive」
ざっくりドラムとかギターの構成になる感じ(雑)
フルオケや生楽器だと重いなぁって時に丁度いい。ドラム君がわりと好き勝手に暴れてくれがち。

「melodic」
大体いつも入れてる。抽象的な表現だけど、各パートが歌って欲しい場面で歌ってくれる。入れてないと環境音楽っぽい方に寄りがちな印象。

「ethtreal」
エーテル感ってなんぞいって感じだけど、とりあえずコーラス系が乗りやすい。くっきりさせたい時には入れない。

「epic」
壮大な感じになる。フルオケやコーラスの力押しブワーって感じ。わりと胃もたれするので他の要素と併せるべし。

「mellow」「warm」
柔らかい感じに寄る……筈なんだけど、たまにエグいのも出てくるからあまりアテにならない。

「melancholic」
マイナーコードに寄りやすいかな。

「A minor」とか
諧調の指定が効くらしいけど、まだぜんぜん効かん。ちゃんと機能するようになったら、キー固定でリミックス生成とかして後でパート毎にダウンロードして混ぜ混ぜできるね。

プロンプト考察

音楽のジャンルタグってわりとアバウトな付き方してると思うんだけど、アレのまんま学習したのを想像すると分かりやすいんじゃないかと思う。
(これバラードじゃねえか、なんでrockタグやねん)とか、
(お前らゲームBGMになんでもかんでもfusionって付けるな)とか、
あの時代を過ごした音楽人ならわかる筈(笑)

この記事が気に入ったらサポートをしてみませんか?