![見出し画像](https://assets.st-note.com/production/uploads/images/134751235/rectangle_large_type_2_89054409dc031b8e55a0e5e835524c53.png?width=1200)
SunoAI V3の所感+プロンプトの疑問点
お久しぶりです、Lu:Na:Clockです。
Noteは大分放置しちゃってましたが、X上ではちゃんと生きてます。
SunoAI V3が無料枠で利用可能に
SunoAIとは何ぞや?という人向けにざっくり言うと、楽曲の生成AIです。
画像生成AIを利用していればイメージしやすいと思いますが、
入力したプロンプトから楽曲を生成してくれます。
その最新版であるV3が無料枠で利用出来るようになりました。
(今までは課金者のみαテストで利用出来ていた)
V2まではラジオのような音質でしたが、V3では少し音質劣化して動画投稿したくらいの音質になったので印象は大きく変わっています。
※今回はインスト曲のみ生成するので生成画面から
常時「Instrument」をONにしています。
![](https://assets.st-note.com/img/1711098290598-rpjaETNDwl.png)
V3での生成楽曲所感
深く考えず初見でこのようなサウンドになりました
早速Suno v3のお試し
— Lu:Na:Clock (@clock_luna) March 21, 2024
生成一発目でこの感じです
曲のイメージは頭で出来ていたのでちびクーちゃんを使って簡単な動画にしました~
こういう可愛くコロコロした音中心で、
雨にもちょっと合うチルな雰囲気良いですよね!
簡単な指定しかしてないですが、プロンプトも後で置いときます#suno#SunoV3 pic.twitter.com/OmpoPhwuon
どうでしょうか?
プロンプトは「pop, kawaii future base, rain drop, chill」
辺りだったと思います。
ジャンルとして「kawaii future base」かはともかく
「 future base」のエッセンスは汲み取ってくれているように思えます。
またメロディーのコロコロした可愛い音はkawaiiやrain dropの
部分が感じられます。
BPMがゆったりなのはchillの影響が大きそうですね。
ちなみに生成は一度に二曲生成されるのでもう一曲も聞いてみましょうか。
・・・おや?
確かに kawaiiやfuture base、rain dropの部分は感じますが
chillでBPMゆったりしてそう、というのはどこにいったのでしょうか?
プロンプトについて
ここで2曲目のタイトルともう一つ注目すべき場所を見てみます。
![](https://assets.st-note.com/img/1711098455449-UxmXUj16JT.png?width=1200)
タイトルは「Electric Raindrop」なのですがその下に、
「kawaii future bass dreamy mellow」とありますね。
繰り返しますが先ほど入力したプロンプト自体は
「pop, kawaii future base, rain drop, chill」です。
・・・もしかしたら入力したプロンプトを適当に解釈して
Sunoに合ったプロンプトに変換してるのでは?
という疑問が沸きましたが確信を持った上で検証したいので、
一旦別の曲を生成してみます。
カスタムモードのお試し
ここである事に気づきます。
よく見るとカスタムモードらしきものがある事に。
![](https://assets.st-note.com/img/1711098850232-FptFjX0Wxv.png)
一旦違うプロンプトでも試してみたかったので
「Japanese city pop, electric piano, cliché, driving midnight,」にしました。
正直日本のCity Pop感は感じられないですが、
一応pianoの要素やdriving midnightの雰囲気は拾ってくれています。
それよりも注目すべきは曲名の下の部分です。
![](https://assets.st-note.com/img/1711099361079-1Bdm3PwKq3.png?width=1200)
先ほどとは違い入力したプロンプトが全て残っていますね。
曲名も入力したのそのままでした。
次に同じプロンプトをカスタムモードを解除して生成したものがこれです。
もう予想はつくと思いますが、曲名の下部は入力した
プロンプトと違いますね。
![](https://assets.st-note.com/img/1711099807026-VuAhI1cSyi.png?width=1200)
つまり初期状態だとどれだけ長文を入力しても、
SunoAIに合ったプロンプトに省略されてしまいます。
画像生成AIのように、日本語の長文を訳して突っ込んでも
多くの意図を汲み取ってはくれないわけです。
省略されたプロンプト例
例として知り合いからもらった以下のプロンプトを、
カスタムモードを使わずに試してみます。
「Create a gothic-inspired musical composition that incorporates elements of classical instrumentation and South American rhythms. The piece should evoke a mysterious and haunting atmosphere, transporting the listener to the misty peaks and ancient ruins of the Andes Mountains.」
ニュアンス的には「クラシックの楽器編成と南米のリズムの要素を取り入れたゴシック風の楽曲を制作して。神秘的で妖しい雰囲気を醸し出し、聴く人をアンデス山脈の霧に包まれた山頂や古代遺跡へと誘うような作品にして。」
といったようになりますが、ゴシック風で怪しいというのは感じます。
ただ他はそこまで反映されていないように思えます・・・。
で、さらに問題なのは省略された後のプロンプトです。
![](https://assets.st-note.com/img/1711100492714-QpO18AJ6jA.png?width=1200)
せっかく長文を入力しましたが表示上は「haunting classical gothic」としか
されてないことが分かりました。
あまりにも短くなりすぎて困惑しましたが、今までの挙動や
雰囲気からして「haunting classical gothic」の部分しか
楽曲に反映されていなさそうに思えます。
では意図通りプロンプトを指定したいならどうするか?
そこで先ほどのカスタムモードの出番です。
無茶なプロンプトの反映具合
ということでカスタムモードならいけるのは?と思ったものの、
ここで問題発生です。
![](https://assets.st-note.com/img/1711101245138-qjyAFhScdJ.png)
何とプロンプトが長すぎて入りません。
調べたところカスタムモードでは、120文字までしか入らないようです。
ということで意図を残せてるかはともかくギリギリまで短くしました。
「gothic-inspired fusion of classical instruments with South American rhythms, evoking misty Andean peaks and ancient ruin」
とりあえずクラシカルで少し怪しい雰囲気は出てますね。
先ほどよりはイメージに近くなっています。
![](https://assets.st-note.com/img/1711101654875-Tm0ocwSl4W.png?width=1200)
そしてカスタムモードで入力したプロンプトなので全文残せています。
要は「まとまったイメージがあるなら、カスタムモードを使用した方が
意図通りになりやすい」という事です。
しかしこの後同じプロンプトで何度か試しましたが
南米のリズムを含んだような曲にはなりませんでした。
普通に考えるとゴシック風のクラシックと南米のリズム(ラテンとか)が
ちゃんと組み合わせられるとは思えないので、画像生成AIのような自由度は
今のところないように感じました。
とはいえ無茶な注文しても反映され無さそうということを
知れたのは収穫でした。
いずれはこういうプロンプトも反映されるようになるのでしょうか・・・?
次回予定
簡単にSunoAI v3について、プロンプトの問題点含め解説しましたが、
次回はある程度自分が意図した雰囲気の楽曲を
生成する方法をまとめようと思います。
今回でまとめても良かったのですがすでに長文になっているので
一旦分けて作成しようかなと。
明日中には完成させる予定なのでお楽しみにです~
2024/03/23追記
生成曲に対しての感想を書き忘れていたので追記
曲自体の品質は現時点で高いですが、同じメロディが続いたり
たまに展開速度にブレがあったり(通常は8か16小節くらいで展開する)
完成とはまだ言えない段階と思いました。
・・・経験上こういう「現時点は~」という問題は気づいたらクリアしているのが生成AIなので数カ月後には多分そんな事も言ってたな
レベルになってそうです。
AIイラストでいうとNovelAI初期~Stable Diffusion1.5中期くらいの
感覚くらいには感じます。
要は油断してると完全実用に近いレベルになってそうという事。
ただ現時点でもメロディが良かったりコード進行もたまにエモかったりと、
音楽をやっている人ならそのまま自分の曲に流用しても良い部分が
あるのはとても魅力的です。
また、普段自分がやらないジャンルの曲のリファレンスを作れたり
マンネリ化を脱却できそうにも感じるので、そういう意味でも
可能性を感じました。
ついさっきクレジットがなくなってProプランにも入っちゃったので、
しばらくはちゃんと使い倒したいです!
この記事が気に入ったらサポートをしてみませんか?