Sunoで楽曲生成を楽しもう！(AI作曲と音楽の未来は？)

僕はまた、旅に出る。

2024年6月19日 18:00

みなさんこんにちは。

最近、AIによる楽曲生成サービス Suno で遊びました。

5~6時間ぐらい遊んでみたので、出力楽曲の紹介 と、現状のAI生成の課題把握、ならびに、作曲の今後、について、考えを書き残しておこうと思います。

Suno とは？

入力文章（歌詞/楽曲スタイル）を元に、曲を生成するAIサービスです。
日本語歌詞のボーカルを含む曲生成も可能です。
生成される楽曲の長さは最大4分。
生成された曲の好きな再生時間から拡張生成することも可能です。

無料プランもあり、有料プランの場合であれば、商用利用もできるとのこと。

制作（出力）した楽曲

今回、楽曲生成を試すにあたり、自分で作詞(プロンプト作成、恥ずかしいですが自分の語彙力で表現)をし、曲生成をしました。
出力した楽曲をいくつかご紹介します。
リンク先から、実際の曲を聴くことができます。

Suno のバージョンは 3.5 です。

自分のポッドキャスト番組をテーマにした曲

自分が作詞した歌詞の稚拙さはさておき、それらしい曲っぽくなっているので、普通に聴けますね…すごい。

同じ作詞でも、音楽ジャンル/スタイルを変えた場合

夏の憂鬱さをテーマに作詞した楽曲です(1曲目好きかも)。

深夜をテーマに作ってみた曲

過去エピソードを元に作詞したもので出力

作詞参照元エピソード

触ってみた所感

ここまで手軽に曲が作れることもそうですが、歌詞もある程度破綻しない形で歌えているのがすごいなと思いました。

ChatGPTなどで作詞生成してしまえば、数秒で(ある程度)期待する雰囲気の楽曲が生成できるようになってしまいました。

すごいと同時に怖さすらあります。

ただ、残念ながら、日本語の読みが間違っている場合が結構あります。

これはおそらく、多言語の楽曲・歌詞で学習されている生成AIモデルが、十分な量の日本語のデータで学習できてないためではないか、と思います。
具体的には、データが十分でないため、出現頻度が低い読み方が学習されてないことが影響しているのだと思います。

もちろん、ひらがなで記載されていれば、期待通りの読みになると思いますが、歌い方のアクセントなどは期待しないものになる場合もあると思います。

生成された曲について感じた課題

良くも悪くも聴ける曲

良くも悪くも、聴ける曲である、という点はあると思います。
というのも、おそらく曲全体を一つの音（楽器のパートごとなどではなく全ての音を合成した状態の音）として出力しているためか、曲が全体的のっぺりした感じがしたり、歌詞の音量が楽器の音量に負けていたり、きちんと歌詞が発音できてない部分がある曲もありました。
ステレオ（左右に音量が振られていて、立体的に聞こえる）である点はすごいと思いますが、このあたりの個別楽器・歌声の音量バランスも改善されると良いなと思いました。

音量差などについては、改善できる可能性があります。

方法の一つしては、プロンプトの指示内容を工夫する（プロンプトエンジニアリング）ことで改善できるのかもしれません。例えば、ノイズっぽい音声になっている場合は、スタイルで high-resolution(高解像度)などのワードを指定することで、クリアになる可能性があります。

また、音声分離も一つの手です。
ボーカル分離のAIなどもすでに登場していることから、二度手間ではありますが、一度、歌声とBGM/instrumentalや楽器ごとに音声分離をし、個別調整ができるかもしれません。

これは、絵の生成などでも言える話なのですが、出力された生成物を後から個別のパーツごとに編集できることが必要になってきそうです。

アーティスト楽曲/ボイスとの類似性

何度か曲生成する中で、音楽を作曲したことない人間でも、楽曲ジャンルの型がだんだんわかってくるような気がしました。
加えて、特定のジャンルにおいて、特徴的な声や歌い方がありそうです。

大量の楽曲で学習されていることから、おそらく有名アーティストっぽい曲も出力できてしまうと思うのですが、Sunoでは、それを防ぐ方法として、ジャンル/スタイル指定でのアーティスト名を弾ける(入っていた場合に出力できないようにする)ようになっていました。
それなりの知名度、人気、楽曲数があれば、特徴量が学習されるので、模倣される可能性が高いためですね。
ですので、一般名詞でも、音楽の領域で、その一般名詞がアーティスト名を指している場合に、弾く可能性があるかもしれません(パッと浮かぶものだと、chili pepper や oasis 、stone に west など、こういった単語は音楽以外でも使われますけど、明らかにアーティストと関連しそうですもんね)

しかしながら、すべてのアーティスト名を弾けているのかが怪しいです。
というのも、アーティスト名で弾けるのは、おそらく有名なアーティストのみだと思います。
一定知名度未満のアーティストだが、それなりの楽曲数があり、特徴的な楽曲であれば、指定できてしまうのではないか、ということと、アーティスト名の書き方を変えたり、別言語での書き方で入力することで、ブロックを突破してしまうのではないか、という懸念があります。

このことから、まだAIとしては不完全な部分もあるので、あくまでも商用利用可(有料プランの場合)とは言いつつ、楽曲作成の補助ツールであったり、商用目的外のBGMとしての活用に止めるのが無難かなと思いました。
自分も、歌あり楽曲を生成する/作ってみることはあっても、曲そのものでお金をどうのこうの…というのはしたくないですね。

気づく、プロの "凄さ"

Sunoを使ってみることで感じたことは、アーティスト・作曲家・作詞家の方々の凄さ、です。

AIで簡単に曲が作れるようになったけど、出てくる曲のままでは凡作です。
なぜなら、AIは大量に学習したデータから、出力確率の高い、それっぽいものを出しているに過ぎないからです。

曲の、淡い輪郭が浮かび上がったに過ぎないです。

音楽作成に関わったことのない自分ですら、AIの楽曲の細かな部分に違和感を感じたのですから、これは間違いないことだなと思います。

プロの方々は、この淡い輪郭の状態から、さらに血の滲むような細かな調整などを重ね、本当の意味での「曲」を作り出しています。

ぜひ、普段聴いている曲と聴き比べてみてください。
アーティストによって生み出された曲との、クオリティーの差ががわかると思います。

「曲の質」が問われる時代への突入

一方で、これからは、より、「曲の質」が問われる時代 になるのだと思います。

今回、Suno で出力した曲の中で、荒削りでも素敵な(好きな)雰囲気だと感じる曲もありました

音楽の分野だけではなく、どの分野においても言えることですが、AIの登場により、プロ中のプロは生き残れても、「そこそこのもの」レベルを作るだけでは、生き残るのが大変な時代になるかもしれません。

もちろん、音楽を聴く側の価値観や倫理観の向上も必要ではありますが、作成されたものの品質によっては、「AIでいいじゃん」になりかねません。

「作成物の質の基準」がAIによって底上げされたことは間違い無いでしょう。

全てのスキルが"自身の言語表現能力"に集約される？

残念ながら(場合によっては嬉しいこともありますが)、AIはここからさらに進化していきます。

加えて、昨今の生成AIについては、タスク指示を「言語」でできるようになりました。

これまでは、何かを実現するためには、タスクごとのスキル(絵を描く、動画を編集する、曲を作る、演奏する等)を身につけている必要がありましたが、これがすべて、「言語」で指示できるようになったということです。

すなわち、すべてのスキルが「言語表現能力」に集約されるということです。

これまで以上に、自分自身の言語表現能力が重要になる時代になるということだと思います。

自分が好きなもの・ことは何か。

自分が表現したいもの・ことは何か。

それらをきちんと言語化できる能力が高い人ほど、この生成AI時代において、活躍できる人材になっていくような気がします。

もちろん、言語化できる=言語という有限の選択肢の中から、ラベル分類する、ということになるので、「既存のラベルで分類できないものを作れること」も、アーティストとしては必要なスキルであることには変わりないと思っています。

まとめと感想

Suno を触って曲を生成してみました。すごい。
表現したい曲を、AIを使って作り出す/探し出すことはありだと思います。現状を理解する上で、音楽を作る人にこそ、触ってもらいたいなと感じました。
著作権や悪用の観点で、悪者されることもあるAIですが、うまく付き合っていくことができれば、曲のレベルをさらに高められると思います。
AIのモデル学習や構築、生成AIを手広く触った経験のある人間としては、楽曲スタイルが曲に与える影響について、調べるのは面白そうだなと感じました。たとえば、楽曲スタイル指定をCity-pop等の明確なジャンルではなく、Anime-endingというような、いわゆるそれっぽい概念を指定した場合にどのような楽曲が生成されるのか、そしてその楽曲はどのようなアーティストの影響を受けていそうかなど。
あとシンプルに自分の語彙力・表現力を向上させたいな、とも思いました笑

今回の話のPodcastエピソード

→7月公開予定（多分生成した曲も番組内で紹介しつつ話すと思います）

番組について

普段は、西暦3000年の人類に向けて、現代人が感じることや、未来についての妄想を発信しています！

6/29(土)にポッドキャストオアシス というポッドキャストのオフラインイベントを開催します！

筆者 Suno アカウント

たまに出すかもしれません。
曲の歌詞も出ているので、上の曲でどんな歌詞を歌っているのか、気になる方は覗いてみてください。
果たして、作詞能力は向上するのか？（これはまた別のテーマとして取り組みたい）

この記事が気に入ったらサポートをしてみませんか？