見出し画像

架空のレコードショップ#3−画像と音楽の生成AIコラボ結果


架空のレコードショップと称して、ジャケット&ミュージックをインスタにて公開しました。

後半6ジャケットはこちら。

音楽のジャンルは、

  • フレンチポップ

  • ロック

  • ポップス

  • フレンチポップ(エレクトロ系)

  • ガラージュ(ハウス系)

  • ガラージュ(エレクトロ系)

ガラージュというジャンルは生成するにあたって初めて知った。
音楽の世界は多岐にわたっていて奥深い。(素人の自分には音楽を聴いてもどのジャンルかすら判別できない!)

ミュージシャンが新たな表現を試す過程でまったく新しい音楽スタイルが生まれるのも珍しくはないのだろう。
それでいうと音楽生成AIが新境地を開拓する可能性も大いにある。そこに人間のクリエイティビティでもって魂を吹き込んだらば、めちゃかっこいい別次元のものになるかも。


画像生成AIと音楽生成AIのコラボはどうなったか

さて、今回のプロジェクトの元々の狙いは、AIに生成させたジャケット画像を参照してAIに音楽生成させるというもの。使用したのはMubert。

しかし、まったく思い通りにいかず。例えばメタル系音楽を載せたかった鳥の画像からはリラックス系音楽が生成されたり、ヒップホップを載せたかったロボットの画像からは機械的なアンビエント系の音楽が生成されたりで、ジャケットに対して自分が思い描いていた音楽は生成されなかった。(というか、ジャケット画像のイメージと音楽を意図的にずらしたかったというのもあるのだけど…)

Mubertは画像から音楽生成できるのが魅力的だけど、画像を読み込ませるとプロンプト指定できないのが惜しい。

ということで、結局は自分が作りたいジャケットの画像生成から始めてそれに合う音楽を生成したり、反対に、生成音楽からビジュアルをイメージして画像生成したり、というプロセスになった。

現時点では生成AIに出来ることは限られているしガチャ要素がめっちゃ強い。

とはいえ、ここまでできることは本当にすごいことだ。(ついつい忘れて完璧さを求めてしまったりするけれど...ありがとうAI)
今はこんな感じで「すごい!こんなこともできるの!」と「やっぱりまだこんなもんかぁ~」を繰り返すのがひたすら楽しい。

そのうち「こんなもんか」なんて言えないほど進化しちゃうのだろうな。反対に「あなたたち人間はそんなもんですか」なんて言われるかも。


MubertとSunoの違い

最初はMubertを開拓していたけれど、電子系に偏っているのと生成結果があまりピンとこなかったため、Sunoにも手を出してみた。
結果、今回の12ジャケットの大半にSunoの生成音楽を使うことになった。個人的にはSunoの方が色々とんがってるし柔軟性もあって新たな発見をくれたように思う。簡単なまとめ↓↓↓


・Mubert
同じようなリズムが多い
画像から生成可能
電子音が強い

・Suno
歌詞まで作ってくれる、歌ってくれる
音楽の特徴を入れると歌詞として歌われることあり(⇒カスタムモードで歌詞と音楽の特徴を分けて入力すると良い)
多言語対応

・共通点
プロンプトは結構無視される(情報が充分にないと生成不可能)



おまけ)日本の演歌をオーダーしてみたら…

ちなみにSunoに「日本の演歌」をオーダーしてみた。
プロンプトはこんな感じ(実際は英訳してインプット)。

“日本の演歌、中年男性シンガー、日本語の歌詞”

生成結果↓↓↓


うーむ。演歌じゃないしおじさんでもない。やはり演歌は情報量が少なすぎるか、そもそも取り込まれてないのか…。
ということで「演歌」の部分を「昭和の歌謡曲」に変えて再生成。

心地よい音だけど昭和の気配は皆無、現代風でおしゃれになってしまう。
そしておじさんの声はどうしても出ない...。

音楽生成AIが発展した未来では、日本の演歌もスタイルとして取り入れられるのか否か?


…音楽生成AIの探求は続く!

このプロジェクトで作成したジャケットと音楽はインスタにて公開してます。ぜひ聴いてみてください🎧

https://www.instagram.com/fantasmagorique_carte/


この記事が気に入ったらサポートをしてみませんか?