見出し画像

The Future of Music 〜生成AIは音楽業界をどう変えるか?〜

こんにちは。株式会社VoiceCastの細谷です。
昨年11月にアメリカの著名VCa16zがGenerative AIと音楽業界についてレポートを発表しました。今回は、私なりにこのレポートを和訳しまとめてみたいと思います。
**このnoteの作者は英語ネイティブではなく誤りを含む場合があります。**


はじめに

2023年は生成音楽の領域にとっては波瀾万丈の一年。
4月にDrakeの”Heart on My Sleeve”のAIによるカバーソングが公開されると、AIによる楽曲は存在するだけではなく優れていると音楽業界が気づき始めた。

その直後、
・Googleがプロンプトから楽曲を生成するMusicLMを発表。
・ポール・マッカートニーが、AIを駆使して抽出したジョン・レノンの声を元に新曲を作成
・Grimesが自身の声を使ったAI楽曲のストーリーミングについてロイヤリティの50%をクリエイターに提供

など様々な動きが巻き起こりました。その中でも最も重要なのは、MetaがMusicGenをオープンソース化したこと。MusicGenはtext-to-musicのモデルだが、公開によってモデルを拡張したり活用したりして新しいアプリケーションが次々と生まれるようになった。

AIによって今まで楽曲を作ることが難しかった人たちはもちろん、アンドリーセンはクリエイターもAIを活用することでよりクリエイティブになるだろうとしている。

we believe that generative music will help artists make a similar creative leap by blurring the lines between artist, consumer, producer, and performer. By dramatically reducing the friction from idea to creation, AI will allow more people to make music, while also boosting the creative capabilities of existing artists and producers.

原文より

この記事ではAIによる楽曲制作についてユースケース別5つの分類+ユーザー別3つの分類に整理して解説をしている。

a16z Consumer

ユースケース

Real-Time Music Streaming

特定のモードやヘッドスペースに入るために終わりのないプレイリストを作成し続けるEndel, Brain.fm, Aimiなどが登場している。このようなFunctional MusicはEndelがUMGと提携するなど既存の音楽と融合しつつある。

AIを活用した音楽のストリーミングサービスはそのほとんどがボーカル無しで提供されている。
一方で過去の聴取履歴やカレンダー予定から、個人に最適化された音楽を適切なタイミングで聞けるようになったらどうだろうか。
Spotifyはパーソナライズされた自動生成プレイリストに向けて2月にはAI DJ, 11月に視聴履歴を学習し1日に何度も更新される自動プレイリスト”Daylist”を発表した。

Spotify Auto-Generated Playlists

AI Covers

AIのカバーソングはAI Musicの最初のキラーユースケースになりうる。上述の“Heart on My Sleeve”が発表されて以降、AIカバーソングは盛り上がりを見せている。TikTok上では#aicoverのハッシュタグが100億回再生を記録している。

このようなムーブメントはAI Hub Discordに所属するクリエイターによって開始された。このコミュニティは、著作権侵害の申し立てなどもあり現在は音声モデルを共有するプライベートなコミュニティとなっている。
ローカル環境で他人の声でカバーソングを作成するにはある程度技術的な理解が必要だが、ブラウザベースで行えるサービスもいくつか出てきている。Musicfy, Voicify, Covers aiなどがその一例。

法的権利の問題は解決していない大きな問題で、この領域に取り組むのならば考慮に入れなければならない。
ただし、過去hiphopにおけるサンプリングなどについてもこのような問題は取り沙汰されてきた。この問題は長い訴訟を経て、オリジナル曲のアーティストたちは、経済的な取り決めによってサンプリングから自分達にも利益がもたらされることに気づいた。

AIによって生成される音楽に驚異を感じるアーティストやレーベルがいる一方で、チャンスだと捉えているアーティストも存在している。Grimesはその代表例。彼女はElf.techという製品をリリースし、彼女の声を使って他の人が新しい曲を作ることを可能にした。彼女は収益を生み出すことができるAIが作成した楽曲には、ロイヤリティを折半すると約束している。

自分のカスタムボイスモデルを提供しAIによるカバーソングを追跡することができれば、新たな収益化手段が生まれてくるかもしれない。

Royalty-Free Tracks (aka AI Muzak)

prosumerに視点を移すと、Youtube動画やPodcastなどコンテンツを作る際にロイヤリティフリーの音源を見つけるのに苦労した経験はおそらくあるだろう。もちろんフリー音源のライブラリーは存在するものの、意図した音源が見つけづらかったり、すでに使い古されていたりする。このような音楽はmuzak, elevator musicと呼ばれて揶揄されたりもする。

Elevator music

BeatovenSoundraw, Boomyなどの楽曲制作ツールによって誰でもオリジナルのトラックを作ることができるようになった。このようなツールはジャンルやムードの選択に加え、曲の編集が行えるものも出てきている。

ロイヤリティフリー音楽のジャンルはコモディティが進みつつあり、将来的には全てがAIによって置き換わるとa16zは予測している。また、これらの製品の初期導入者は、主に個人のコンテンツ制作者や中小企業であるが、ゲームスタジオのような大企業への従来の企業向け販売と、APIを介したコンテンツ制作プラットフォームへの組み込み音楽生成の両方の観点から、市場規模を拡大していくと予想している。

Music Generation

大規模な生成モデルと音楽が融合して可能になる最もワクワクする意味合いは、プロシューマーがプロ級の音楽を作れることだろう。手助けとなる主要な機能は以下のようなもの。

  • Inpainting

  • Outpainting

    • 曲の一部を与えると続きを生成する

    • MusicGenがcontinuationなどで実装中

  • Audio to MIDI

    • オーディオを編集可能なMIDIのフォーマットに変換する

  • Stem separation

    • Demusなどのテクノロジーを活用して、曲をボーカル・ベースライン・パーカッションなどに分離する

未来の作曲家のワークフローは以下のようになるかもしれない。

  1. サンプリングしたい適切に雑音のない楽曲を手に入れる

  2. 楽曲の要素ごとに分離させてMIDIに変換する

  3. シンセサイザーでいくつかの音節を演奏しinpaintingで曲の間を埋めていく

  4. outpaintingによって音源を拡張する

  5. 特定のスタイルでマスタリングまで行う

制作過程の一部に焦点を当てたソフトウェアは徐々に出始めている。サンプルの生成(Soundry AI)、メロディの生成(MelodyStudio)、MIDIファイルの生成(Lemonaide、AudioCipher)、さらにはミキシング(RoEx)などだ。

Professional Tools

最後にアーティストや作曲家が制作過程において使うようなプロフェッショナルツール。それらは 3 つの主要なカテゴリに分類できる。

  1. ブラウザベースツール
    編集・制作の一要素に特化していて、従来のソフトウェアに依存することなく誰でもアクセスできるツール ex Demus, Lalal, AudioShake, PhonicMindなどの音源分離ツール

  2. AIを活用したVSTs(Virtual Studio Technologies)
    Logic ProなどのDAW製品に繋げて使うようなソフトウェア ex Mawf, Neutone, Izotopeなどを使うと従来のDAW上でサウンドの合成・処理が行える

  3. DAWを代替するもの
    現在の主要なDAWは20年以上使われてきている。TuneFlowやWavToolはDAWそのものを置き換えようとしている。

Music’s Midjourney Moment

MidjourneyやRunwayはプロフェッショナルでなくても高品質な画像・動画制作を可能にした。このようなMidjourney momentが音楽生成においても実現しうるとa16zは予測している。

感想

記事自体が公開されてから3ヶ月ほどしか経っていないですが、すでに一部の予想が実現できていたり新たなユースケースが生まれているように感じました。

一例としてSuno AIがあげられます。BarkというText2Audioのオープンソースな生成モデルを開発したSunoがプロンプトから楽曲生成が行えるSuno AIというサービスを公開しかなり話題になったことは記憶に新しいですね。

Music Generationで紹介した試みの最終形態とも言えるかと思います。日本語で楽曲を作ってみてもある程度は感情表現のこもったコンテンツが生成されます。

一方で、まだまだ完全とは言えないのが現状。私自身は、クリエイターとAIが共に制作することで良いコンテンツが生まれていくのではと想像しています。人間の手が不要になることはないと思います。

最後に

2024年は音声AIの盛り上がりと共に音声の魅力そのものに注目が集まる年になります。
私たちはAIを活用しながら音声コンテンツの制作を行い、その魅力を最大限に伝え音声クリエイターが輝ける社会を目指しています。

✅ラジオやPodcast, ボイスコミックが好きな方
✅音声AIに関心のある方
ぜひ面白い世界を一緒に作りましょう!ご連絡お待ちしております!!

連絡先:
https://twitter.com/chaichai_1551


この記事が気に入ったらサポートをしてみませんか?