松尾公也さんに聞く「生成AIとテクノロジーによるクリエーション」(01)
今回から対談は新シリーズ。お相手は編集者の松尾公也さん。
以前にも出ていただいたことがあるが、今回はまた別のテーマで出ていただく。
軸になるのは「AIやテクノロジーでなにかを作ること」だ。実は松尾さん、先日以下のような書籍を出された。
・Suno AIではじめる音楽生成AI入門 (秀和システム)
松尾さんはCG雑誌の編集者だったこともあり、PC創世記から、音楽とCGの両方を実践してきた方でもある。昨今は生成AIを使い、奥様をモチーフに多くの作品を作っている。
そして実践者でありつつ、「反AI」な人々の矢面に立つことも多い。
そんな松尾さんにとって、「テクノロジーでなにかを作る」ことはどんな意味を持っているのだろうか。そして、そこで生成AIはどんな価値を持っているのだろうか。
色々と聞いてみた。(全6回予定)
■PCと音楽の歴史を振り返る
西田:以前に出ていただいたのが結構前ですよね。
松尾:だいぶ前ですね。
西田:今回は松尾さんが本を出されるということで、それの宣伝も兼ねてということなんですけど。
ここ数年やっておられることを考えて、AIで何かを作るってのはどういうことなのかについて、ちゃんと話を伺っておきたかったというのがあります。
もちろん、正直な話プラスマイナスの両方を聞かなきゃいけないと思うので、その辺がポイントになってくるんですけども。
まずは、読者の方に向けて自己紹介をもう一度お願いします。
松尾:はい。私ですね。生まれは1959年で、現役の編集者としてはたぶん最年長ぐらいになると思います。
もともとは紙の業界紙『電波新聞』というところからスタートして、途中で『MacUser』の編集長をやったり、その後はオンラインメディアで「ZDNet Japan」、今の経営とは違いますけど、ソフトバンク系の「ZDNet Japan」、それから「ITmedia」になって、現在は所属としては「テクノエッジ」ということになります。
西田:はい。それで、今回のテーマになる「AIでいろんなものを作る」。
いろんなものを作るというか、正確に言うと、映像であるとか音であるとか、写真であるとか画像を作るという話なんですけど。
最初に、AIがない頃からいろいろ作られてましたよね。ひとつのきっかけとしては奥様の件があるとは思うんですけども、AI以前からどういうふうに作品作りみたいなものを始めていたのか。
それがAIを取り入れるきっかけがどうなっていったのか、その点を教えてください。
松尾:そうですね。もともとはDTMを、DTMという言葉が生まれる前、MIDIが生まれる前からやってたんですよね。
その時は8ビットコンピュータのMZ-80K2Eというモデルと、ローランドの子会社でAMDEK(アムデック)というところがあって、そこのCMU-800というハードウェアシーケンサー、あとシンセサイザーを組み合わせて今のDTMの源流みたいなことをやってて。その頃から何がやりたかったかというと、音楽を楽をして作りたかった。
コンピュータをやったのもそうだし、シンセサイザーをやり始めたのもそうだし、とにかく楽をしたかったというのが大元にあって、何かそういうテクノロジーの進化があったらそれを取り入れてやってきた、というのがそもそもあって。MIDIが出たらPC-98とローランドのMIDI音源をつなげて曲を作る。それもだいぶ楽になったんで。そこで曲を作ったりとか。
初音ミクが出た時には、歌声がすごく簡単にできるというのと、あと、それを投稿する場所が生まれた。ニコニコ動画、YouTubeというのが生まれて、自分で曲を作ってそれをみんなに見せていいんだ、聴かせていいんだという機運が生まれて、その頃から活動を始めてたんですね。
それが2007年ぐらいですかね。
西田:ちょっと確認です。
MIDIだとか、MIDI以前もそうですけど、音楽をコンピュータでやるというと、たぶん2つの入り方があって。
もともと通常の楽器をやってたんだけど、もっと新しい楽器、もっと楽な楽器が出てきたのでコンピュータに……というパターンがひとつ。
もうひとつは、コンピュータをそもそも使い始めてたけど、「自分は楽器は弾けないんだけど、これなら自分も音楽が作れるらしい」ということで入っていくパターンとがあって。
松尾さんの場合、どっち側だったんですか?
松尾:僕はもともと楽器はやってたんだけど、楽器があんまりうまくなくてですね。
西田:もともとやってたのはなんですか。
松尾:もともとはキーボードと、ギターもやってたんですけども。
ピアノとかオルガンとかの演奏は、すごくうまい人が周りにいるわけです。そういう人たちに対抗していくためには、なにかテクノロジーの力を借りようと。シンセサイザー、楽器を買えばそれでなんとかバンドの仲間に入り込めるというのがあって。
あとは、演奏自体を楽にしたい。当時、シーケンサーというのがあったんで、自分がすごく練習をしなくても、ある程度の形になるようなものをライブで演奏することもできるようになる。こっちのほうでしたね。
西田:そして、そこからずっと音楽を作ってきて、発表の場というのが先ほど、おっしゃられたようにニコ動とかYouTubeが出てきて、そこにいろんな人が出すようになってきた。作っても人に聴かせないと、音楽の場合は面白くないので。
それが、動画投稿ができるようになって変わってきた、というところはあって。それがまず第一弾ってところですよね。
松尾:そうですね。
西田:そこから次の段階に変わるって、なんでですか?
松尾:当時から初音ミク、VOCALOIDが出てきてはいたんですが、同じような時期にUTAUという別の技術が出て。
VOCALOIDは商用音源なんですよね。商用の会社、ヤマハがやってるところなんで、多分、数百万円、数千万円に近いぐらいのお金がひとつの音源を作るのにかかるんですよね。
それを個人でできるようにするという機運が生まれたのが、UTAUというプラットフォーム。
そのソフトウェアを使うと、自分が何時間か録音して、その歌声を切り張りしてシーケンサーのようなスタイルで入力すれば、自分の歌声であっても他の人の歌声であっても使うことができるという。それがあったんですね。
それで自分で試したりとかもしてたんですけれども。VOCALOIDやUTAUとかいった音声合成を自分でも試して、それを記事にするといったことをやってましたね。
■声が「デジタル楽器」になっていく
西田:声というのをひとつの楽器として考えたときに、ボーカルの部分ってテクノロジーが進化するまであんまり手を入れられなかったというか。
ボーカルをデータ化して切り張りするということはできたわけだけど、そもそもちゃんと一回歌ってもらわないとだめだったのが、なんだかんだいってテクノロジーの進化によって、「音をちゃんと合成して歌声を作れる」ようになったというのはポイントだと思うんですね。
で、気がついてみると、もうそれも15、6年経ってるわけですよね。
松尾:そうなんですよね。
西田:昔はちゃんと歌わせるというか、ちゃんと音声を合成することですら難しくて、いまだに新しい生成AIのサービスの売りが“滑らかな音声”って言ってるわけで。人間とまったく同じ言葉を喋らせる、歌わせるって、まだ難しいところはあるんだと思うんですよ。
そこで15年前に初音ミクだったりUTAUが出てきて「ちゃんと歌ってる感がする」ようになった。
でもそれなりに技術的な限界があったわけですよね。
それが、「これでもいけるんだ」というふうに、技術的なブレイクスルーがもう超えたと思った理由って何なんですかね。
これは実は前からあの界隈の人には聞いてみたいところがあって。一方の、どう言えばいいのかな……。初音ミクが嫌いな人というのもいるわけですよ。未だに。
松尾:はい。
西田:ああいう人たちから言わせると、「あの音、声は不自然だから」とかいろんな文句は言えるわけですよね。
一方で、作ってる人からすると、ああいったVOCALOIDみたいな合成音声で歌わせることがちゃんと定着していったというか、これはこれでいいものだ、ということで受容されていった歴史があるわけですよね。
キャラクターとしての受容の歴史は別として、これはこれで話し始めると大変なところがあるんですけど、それは別として。
じゃあ、作り手にとって、確かに人間の声とは違うけれど、ちゃんと人間のように歌ってくれるもの、というのはどう受容されていったのか。
これは実は、今回の本筋であるところの、AIによる人の再現であるとか、AIによる新しい作品を作るということにも結果的にはつながってきてると思ってるんですよね。
どう受け止められてきたのか。最初にどう感じて、それがどう受容されて、どう昇華されていったのか、というのが、実は前から、完全な答えは僕は持ってない。
なぜなら自分が音楽を作らないから、聴くだけだからだとは思うんですけど、その点どう見てたのか、それをちょっと聞きたいなと思うんですよね。
松尾:ああ。
その当時の考えとしては、ちょっと思い出すと……その当時の音楽の作り手というのは、自分の声というのを、シンガーソングライターであれば自分の歌声で曲を作れるけれども、自分の歌がうまくないとか、音域が合ってないとか、実は自分とは異なる性別の曲を作りたいとか、そういうニーズに応えられるような環境というのはなかったわけですよね。
だから、自分が作りたい曲と、自分ができる歌には結構乖離があって、そこのニーズにフィットした、というのがまず、VOCALOIDが成功したというのがあって。
あともうひとつは、ああいう声。VOCALOIDには「1」というのがあって。初音ミクが出た時にVOCALOID2になったんですね。
西田:あれが2の時でしたっけ?
松尾:ええ。それで一段階クリアさが上がったというのがあって、その点ですごく実用的になったというのがあるんですけども。
もうひとつの要素としては、そのちょい前にPerfumeが流行ったじゃないですか。
西田:ああ、はいはい。
松尾:Perfumeが流行って、で、あれはAuto-Tune(オートチューン)という音声の加工ソフトで、相当ロボット的な声に変えてるんですよね。
なので、ああいう加工した声が受け入れられる状況というのが、もうある程度できてしまった。
中田ヤスタカさんとか、そういうプロデューサーによって、そういう受け入れやすい土壌ができあがってきたというのがもうひとつの理由としてあると思うんですよね。
西田:なるほど、そうか。タイミングとして僕もきちんと理解はしてなかったんですけど、Perfumeってそうか、VOCALOIDよりちょい前なんですね。
松尾:前なんですよね。
西田:Perfumeもあれもなかなかすごくて。
本当に中田ヤスタカ以前って、言葉はよくないけど、単なるアイドル歌唱で、なんか似ても似つかない感じだったんですよね。
それが確かに、あそこでAuto-Tuneをかけて、声をかなり変えてあげることによって、ある種のキャラクター性というか、「そういうアーティストはここにしかいない」的な感じができたから今に至るんだと思うんですけど。
ああいう声があってそういう曲のジャンルがあっていい、というのが当たり前になってきた最中というか、当たり前になる過程でちょうどVOCALOIDが生まれたからこそ、歌の聞こえ方としてああいう範疇のものとして受容されやすかったってことですか。
松尾:ええ。まず最初に出てきたのがEDMなんですよね。
本当、中田ヤスタカ風のEDMで、Auto-Tuneっぽい、Perfumeっぽいボーカルが初音ミクにすんなりはまったと。その後でいろんなバリエーション――高速に歌わせたりとか、ボカロらしい曲というのが出てきたんですけども、最初はEDMだったと記憶してますね。
西田:そうですよね。自分がこれまで自分の声で歌うしかなかったところから、もっと幅を持たせられるというところが明確に見えてきたので、ツールとしてVOCALOIDやUTAUを使う形になってきたってところなんですね。
松尾:そうですね。僕は自分で歌ってもよかったんですけども、それだとなかなかオーディエンスはつかないじゃないですか。
西田:ああ、まあ、確かに。
松尾:聴いてもらえる場所がニコニコ動画、YouTubeでできて、そこに曲を投稿してもいいという。
あと、もうひとつの状況としては、投稿する場はありましたと。
ただそのときに、ニコニコ動画もYouTubeも、まだ既存の楽曲を投稿してはいけない状況だったんですね。音楽著作権の協会、例えばJASRACとか、海外だったらASCAPやBMIとか、そういうところと契約を結んでなかったんで、既存の楽曲を投稿してはいけない。
それでもアングラ的に投稿するのはあったんですけれども、だったら自分たちのオリジナルを出そうぜ、みたいなことで、オリジナル曲のムーブメントが生まれて、たくさんのいい曲が投稿されてきた。
中にはセミプロの人たち、プロの中でもそれほどメジャーでない人たちが隠れて自分の曲を発表して、みんなに受け入れてもらえる、聴いてもらえるというところが、初期のパワーを持たせてくれた動きだったと思うんですよね。
西田:いろんな人が投稿はするけれど、質が低い時だと、やっぱり低い中で競い合うことになるから、そんなに活性化ってしないと思うんですよ。
でも、クオリティの高い人たちが入ってくると、それに引きずられて良くなっていくという現象があると思っていて。
初期のボカロの投稿を見てると、明らかにその後大きくなった人とか、メジャーになった人がレベルの違う曲を上げていくことによって急速に活転していったという感じはしますね。
松尾:はい。今のJ-POPの根幹、一番売れ線のところがボカロ関係の人たちだったりするんで、結果的にそれは大成功を収めたということになると思いますね。
西田:そうですね。
これはたぶんもうすぐ掲載されると思うんですけど、ソニーミュージックに今の音楽のマーケティングの話を聞きに行ったんですね。
彼らは実はオリジナルのマーケティングツールを作ってて、SNSとか音楽の売上とかデータを全部ガバッと持ってきて、今はちょっとしか見えてない売上が上がり始めたピークみたいなのを見て、「これ来てるから、このところにちゃんと宣伝をつけよう」とか、「プロモーションを打ちましょう」みたいなやり方をするようになってるんですよね。
そのきっかけみたいなのになってるのは、新しい才能が出てきてそれを売り上げるというとき、昔だったらディスクしかなかったので、最初の2週間のために全部マーケティングをしてたんだけど、もう新しい人たちはそういうのではだめだと。売れ方も違うし、逆に言えば、新しい人の旧譜が売れるときも売れ方が違うから、というので、コロナ前ぐらいから大きく方針を変えて、売り方を変えたら、今の音楽シーンが全然変わっちゃった、みたいな話はあるみたいなんですよね。
すなわち、新しい才能が出てきたときって、ディスクを売るという旧来型のプロモーションとは違うところから出てきた人たちなので、それの売れ方も違うんだな、というのは思ったところなんですね。
若干ズレる話ではあるんですけど、でも新しい才能が出てくるときに結果的に、旧来のポプコン(ヤマハポピュラーソングコンテスト)などでバンドとして、もしくは顔がいい子をピックアップしてトレーニングして歌手として、みたいな話とは全然違う生態系ができてきたというのがここ20年だと思うんです
その結果の中の一つに、音楽投稿文化というのもあったんだな、というのを今ちょっと頭の中で思ったんですけど。
松尾:今、ソニーミュージックの話が出ましたけれども、ボカロ文化が花開いたとき、わりとすぐに乗り出してきたのがソニーミュージックなんですよね。〈物語〉シリーズの主題歌でSupercellを採用して、あれが大ヒットしてるじゃないですか。ああいうところの目のつけ方は早かったですよね。
西田:やっぱりなんだかんだ言って――これはゲームとかを取材しててもわかるんですけど、ソニーミュージックが必ずいいものを作るかは別の問題として――大きな会社にしては早い時期から目をつけるんです。
例えば、ソニー・コンピュータエンタテインメントを作ったのもソニーミュージックなわけですよね、極論すれば。ソニー本体ではなくて。
そういうところの文化というのはなんだかんだ言ってあるんだなと。
それはアメリカのソニーミュージックとも全然違う。結局、アメリカのソニーミュージックってEMIだったりとか、ああいったところの集合体なので当然形が違うわけだけど、日本のソニーミュージックは、新しいものにとりあえず手を出して、当たるかどうかわからないけどやってみようじゃん、みたいな文化がある、とても珍しい会社なんだな、というのは、時々思うときはあります。
松尾:そうですね。
西田:いいことばっかりじゃないですけどね。いいか悪いかじゃないんだけど。
松尾:失敗もあるけれども、Music Unlimited、ストリーミングのSpotifyにスイッチしちゃいましたけども、あれも早かったけれども、撤退も早かった。
西田:とりあえずやってみようぜ、というのは日本の中では早いという。ソフトウェア作りは徹底的にだめなのであれでしたけど、でもやること自身は頑張ってやってるというのは面白い会社かなとは思います。
ここから先は
この記事が気に入ったらサポートをしてみませんか?