2024/06/30

2024年7月1日 01:38

夏の訪れとともに解離状態と自我喪失状態からやや帰ってきつつある気がするので、メモを。2TBもSSDのデータを吹っ飛ばすと私の場合は解離することがわかった。今後、要注意だね。さて今日はAIの話をしたいと思う。

生成AIの話

Stable Diffusionが2022年にローンチされてから生成AIというものがどのようなものなのかが大衆に認知され始める。横目に見ていた私はいずれは音楽も生成されることになるだろうなという大凡の懸念はあったもののまだもう少し先だろうとのんびり構えていたらそれから2年経ち、案外と事態の展開が早い。いちいち進捗を追っていたらプロ驚き屋などと揶揄されかねないが、Suno.aiなどは存外に出来が良い。ということで話の枕に驚き屋をやってみることにする。この記事は個人のメモであるのでここのサービスに対してのレビューは行わないし、書かれた内容の質も保証しない。

Suno.ai - ゲームのカード落としちゃった
例えるならLiDARやら3D Gaussian Splattingで撮影した空間にあるようなパーティクルの荒さのようなものが感じられるなど音質で課題は残るものの、「ゲームのカード落としちゃった」というフックは頭の中でリフレインするし、スマホのスピーカーでパッと聴きでなんとなく面白いネタをシェアできるというポピュラー音楽の「これでいいのだ。」とでもいうラインは超えてきている感じがする。ここまできたらあとは時間の問題だ。

Google V2Aによるfoley

2. Horror

Audio prompts: Cinematic, Thriller, Horror movie, Music, Tension, Atmosphere, Footsteps on concrete pic.twitter.com/e09r08pHhU
— Sai Rahul (@sairahul1) June 26, 2024

ビデオを提示するとそれに対応した音声を自動で生成してくれるというGoogle V2Aのデモ動画には度肝を抜かれた。セリフなんかはまだ不自然さは残るが、上に挙げた動画のfoleyはなかなか使えるレベルなのではないだろうか？これがAIにビデオを提示するだけで生成されるのは驚きだ。

3. Bikes pic.twitter.com/GWJYGNxBZg
— Sai Rahul (@sairahul1) June 26, 2024

同じくV2Aによるものだが、最近サボり気味のロードバイク乗りとしても違和感をあまり感じないという出来栄え。

Melisma (beta)

こちらは楽譜浄書ソフトで書いたMusic XMLをアップロードすると弦などの演奏を生成してくれるAI。一定の音楽リテラシーを必要とする楽曲製作者向けのものになる。少し前に使ってみたが、やはり生成AIに共通して見られる粒子感とでもいうのようなものはあるが、個人の感想としては十分オケに混ぜて使える品質があるように感じた。開発も継続中とのことなので今後も目が離せない。

Synthesizer V AI

ランサムウエア事件で渦中にあるため動画は貼れないが、ニコニコ動画などで音質比較といったらLia - 鳥の歌が鉄板であった。これは1年前の動画になり最新の話というわけではないがSynthesizer V AIの重音テトで歌ってみた鳥の歌ということになるがまず聴いてみてほしい。2007年のボーカロイドPにこれを見せたら卒倒するに違いない質感だ。いわゆる神調声。

「学習データとしてボーカルデータを学習させている」とのこと。生成AIのように自動で生成というよりは、音程と音価と歌詞をピアノロールで指示する製作者寄りのAIだ。

生成AI時代の音楽環境を想像してみる

1)生成AIにより音楽リテラシーがほぼない人でも新しい曲や音を生成することができる(Suno.ai, Google V2Aなど)。また、2)音楽リテラシーを持った製作者側が音楽的な要素を入力してあげると演奏を行なってくれる(Melisma, Synthesizer V AIなど)サービスの潮流がある。1)に関して言えばパッと聴いてネタとして面白い楽曲は作れてしまっているし、2)の進歩も目覚ましい。また一段音楽制作の民主化されたとでもいうべきか、音楽家にあった特権はまた少し消えていく。そして、先ほど貼ったSuno.aiにより生成された音楽を見る限り案外リスナーに自然に受容されているように思える。これはイラストにおける生成AIが嫌悪されている状況とは少し異なるように思える。

ミュージシャンの収益モデル
数百万回再生のストリーミングやライブ出演で稼げるミュージシャンの氷河の下には広告などのクライアントワークで稼いでいる人々がたくさんいる。こうした広告を発注している代理店側が音楽を作れない部分を作家が作るという情報の非対称性で商売をやっているわけだが、今後は発注側が生成AIを使って音楽を当てるケースは具体例は確認していないものの既にありうるはず。プリビズやVコンの段階では生成AIで音を当てて、それを作家にプロンプトのような形で提示して最終系を作ってもらうという発注もありうるかもしれない。過渡期には例外処理を人間がやる、AIのお守り役ということになり、生成AIが十分に発達したあとはお役御免となる可能性がある。実例はリサーチはしていないが、可能性の話として読んでほしい。

また広告のみならず劇伴やアーティスト(シンガー)向けのオケもそう状況は大差ない。Audio to Scoreのような仕組みが仮に出てきてしまえば生成AIが作った曲を人間が手直しし、演奏の段取りと収録をすれば良いということになる。生演奏の価値は上がると思うので、作曲家はAIとの橋渡しを演奏家と行うオペレーターということになる。人間の演奏と寸分違わない生成ができるようになった時点であとは生成にまつわる諸々のコストの多寡で判断される。

想定されうるデストピア (late 2020s - 2030s)
商品として限られた時間と予算内で作らないといけない音楽や劇伴は生成AIによるものがシェアのほとんどを占めるようになり、ビジネスの需要から音楽は作られ、リスナーもそこまで違和感を覚えないままぼんやりと受容していく。ポピュラー音楽シーンでは生成AIを活用した演出の上手いタレントが市場シェアを取っていく。この際特に音楽リテラシーは今(2024年)よりも必要とされない。身体性、パフォーミングアーツの価値がさらに上がる。

私はどう生きるか？
AIの解説記事ではなく個人のメモ書きなのでここにきて突然私はどうするかということを書く。

「え、そんな生成AIが作る音楽でみなさん満足なんですか？」と言いながら、ファイナンスは適当にやりつつ、完全自分領域で山奥でピアノやシンセや楽器や楽器でないものを弾いてレコーディングし、AIで生成させた音も使ったり使わなかったりしながら、たまにしれっと人前で弾いたり音声ファイルを公開したりするしかないんじゃないですかね。生成AIで作られた音楽や、マネーに作らせられている音楽を聴く時間はないよと言い、制作物にアニマやアウラや気を込めつつ懐古趣味を引きずりながら。

というわけで、ポピュラー音楽に電子音楽やダンス音楽を混ぜていき美味しいところを探していくのがやっていて楽しいことだったYoshino Yoshikawaというプロジェクトにはゆっくりと飽きつつあり、これもまた解離の原因になっています。人名みたいな名前にするんじゃなかったよ。ポピュラー音楽はテクノロジーの力を借りてyouthが作りyouthが消費するものであったし、これからはAIでさらにそれが拡大する。Don't trust over thirty. パフォーマンスをしない作家というモラトリアムもほぼAIにより潰えることが確定してしまったので退路はゆっくりと消えていきます。

あと、ポピュラー音楽が文字通りpopularであるために自分の好きな音から遠ざかることが許せないまま妥協点を見つけられずに時間が経ってしまったので、そろそろ本当に自分で自分のパトロンになり自分領域を逃げずに正視して追求したらいいんじゃないかと思います。ああ、本当に面倒くさい。

弦がたくさん並んでいる楽器を弾いた時に、音をLR高低で図示した時にちょうど眉間の先あたりに見える干渉縞やらあるいはお茶のとろみのようなものが綺麗で、これを一番気持ちのいい状態で聴くにはどうしたらいいのかということを試しているのが今一番楽しいわけです。やっぱり物理の音って綺麗なのか。好きな曲を聴くと、「ああ、あなたもそこに気づいていましたか…」となる瞬間がたまらない。ではそのゴールにDTMをどう使うのか、あるいは使わないのかということを吟味しているうちに作品がどんどん出せなくなっていくわけです。これはもう諦めて、少し前の考えで作られた音源をそろそろ出そうかと思います。AIを使わないポピュラーではない最後のポピュラー音楽となるでしょう。

干渉縞のようなものは物理に近い低水準の話で、高水準の話だとジャンルであるとかスタイルであるとか年代であるとかの話になってくるわけですが、現代人はデータベース化されたライブラリ(配信サービス)を持つ無限遠点にいるわけなので好きな音を引っ張り出してきたらいい訳です。世の流行りを追っかけているようでは生成AIの雪崩に飲み込まれるでしょう。しかしながら、軟弱さゆえにちょっとジャンルやシーンやリスナーに目配せした音を作ってしまっていた事は多々あり、あまり許せないでいます。

解離するたびに重要度を決めていた部分が壊れるので、これには本当に困っています。そして、シーンや空間や人やそれにまつわる芸能的なあれやこれやが好きなわけではなく、心地の良い音や音楽が好きなので、そういうのは放っておいてやらなければならないのは楽器の練習。実に道楽だね。でも、道楽的マインドで作られた音楽っていいよね。

Twitter(X)は最近気持ち悪いのでもうしばらくデジタルデトックスの気分です。巷で見かける世界が終わる、何かに乗っ取られるなんて話はほどほどにして、健やかに生きましょう。ところで道楽の他にはそういった憑き物を落とす音/音楽には興味があるかもしれない。ひとまず今日はここまでです。

この記事が気に入ったらサポートをしてみませんか？