2024年夏: 生成AI普及後のコンテンツの在り方と未来を予想してみる
あれよあれよと過ごしている間にもう2024年も9月になってしまいました。今期アニメも終盤で時が過ぎるのは早いものです。何かやるべきことを全然やれていない気がして非常に焦る…。
さて今日は某 Discord サーバーでいろいろな人と AI 関連の意見交換というか雑談をしていたのですが、話していくうちに自分の頭の中で点と点がつながりしっかり考えとしてまとまったことがいくつかあったので、覚えているうちに書き残しておこうと思う。
全てあくまで私見だけれど、今の世の中の流れを鑑みると、割と確度高い予想ができているんじゃないかと思う。
TL,DR
現在生成 AI コンテンツがまだあまり世に出回っていないのは (技術的な課題ももちろんあるが、それ以上に) 推論コストの問題が大きいと考える
今は(例えば画像生成であれば)1枚生成するのに時間も掛かるし大量の CPU / GPU リソースを必要とする(≒生成コストが高い)ので「UI を表示する毎に即席で生成する」なんてことが現実的にはできず、結果誰かが生成 AI を使ってプロンプトからポン出ししたイラストが Pixiv や Twitter で好評を博していたりする
要は今はまだ時間やコスト面であまり無駄打ちできないので、そこそこ慎重にプロンプトを書いて残機を浪費しないように良いアウトプットを出す必要があるし、特にサービス化する場合は富豪的に生成しづらい
誰しもがそこまで生成に時間やコストを掛けられないので、既に誰かがやってくれた成果物を見たり買ったりする需要が成立しうる (既に Pixiv の R-18 イラスト系ではだいぶ成立している印象)
しかし、仮に推論コストが著しく低くなれば(例:一般的なスマホのオンデバイスで一枚1秒未満で生成できるようになれば)、『レコメンド結果に応じて、ユーザーが好きそうなコンテンツを生成 AI で無限生成』できるパラダイムシフトが起こる
要は富豪的にバンバン生成 AI でコンテンツを機械的に大量生成できるようになる
そして生成 AI が出すアウトプットは、『単体の質よりもユーザーの Attention を引き出し報酬系を刺激できる』コンテンツが求められている、TikTok 系ソーシャルメディアとの相性が著しく良い
(私は TikTok のコンテンツが好みでなくさほど使っておらず、解像度が低い可能性がある、というのを割引いて読んで欲しいが) TikTok はスワイプですぐ別のコンテンツが自動再生されるあの画期的な UI が示す通り、動画コンテンツ単体の質は YouTube など他媒体と比べさほど求められていないように思うし(むしろ頭を使わずに”眺めて”楽しめるコンテンツが求められている印象)、ユーザーが好むコンテンツをいかに無限に提供して滞在時間を最大化するか、という問いに高度に最適化された設計になっていると感じる
昨今の Runway とかの動画を見れば分かる通り、生成 AI で作った動画は、長時間一貫性を持ってストーリーや表現を保つことが苦手な傾向にある
他方 TikTok で流通してるような数秒〜数十秒程度のショート動画であれば推論コストも安くでき、しかも生成 AI は人間が作ると非常に手間がかかるようなパッと目を惹く奇抜な表現が得意なので、相性が抜群
推論コストが低くなれば、生成 AI で特定ユーザーに高度にパーソナライズされたコンテンツを際限なく提供できるようになるので、滞在時間はより最大化されるだろうし、当然病みつきになってやめられなくなる人も増えるだろう
実際 TikTok は MagicAnimate という TikTok のダンス動画を自動生成する生成 AI を開発するなど、コンテンツ生成系 AI の開発を水面下でいろいろやっているようであり、今後推論コストの低下ともに生成 AI コンテンツがソーシャルメディアに実装されていくのは自明だと思われる
TikTok に代表されるレコメンドファースト UI / UX のアプリ/サービスは生成 AI によりさらに強化され、分野を超えた横展開が可能になる
例えば TikTok の UI をそのまま生成 AI イラストが無限に出てくるアプリ (特に R-18) に置き換えて想像してみると、流行りそうなのが容易に想像つくと思う
アプリを開くと生成 AI イラストがまずドーンと出てきて、すぐスワイプしたなら「これ系の画風は好みじゃないんだな」と学習して違うテイストのイラストをその場で生成して出す、長く滞在してたり「いいね」したイラストは「こういうイラストが好きなんだな」とレコメンドシステムに解釈され、例えば横にスワイプすると類似構図の少し違うイラストが出てくる…だとか
こういう高精度なレコメンド自体は既に TikTok で行われているが、それと生成 AI が組み合わさることで、パーソナライズが完了すると「自分の好み (あるいは性癖?) に一致するイラストが無限に生成される最高アプリ」になるであろうことは簡単に想像できる
今までは人がコンテンツを制作していた以上、どうしても「特定個人の好みにドンピシャで刺さる」コンテンツを届けるのは難しかったが、「より個人にパーソナライズされたコンテンツを」「大量に」届けられる生成 AI であれば、それを実現できる
生成 AI コンテンツが広く流通する世の中では、『それでも人間が心を込めて作ったコンテンツの方が好きだし好み』という人と『人間のアウトプット以上のものになってて自分の好みに合ってるなら AI 生成でも問題ない』という人で価値観が大きく二分され、二極化が進んでいく
それ以外のトピックでも「それでも人間のがいい」vs「AI 生成のでも実用性があれば/自分にとって良いものであればいい」など、価値観の断絶・分断が発生していくことが予想される
これは何も今に始まったことではなく、既に「Twitter ~ ニコニコ動画 ~ 5ch あたりのネットカルチャーに親しみがある層」と「Instagram - TikTok あたりの新興 SNS に使っている層」で好むコンテンツの価値観そのものが大きく異なってきていると感じる
その点で YouTube は層を問わず誰しもが触れるサービスなので、YouTube ショートは TikTok よりも広く受け入れられる土壌を持ちつつ、それでいて TikTok の報酬系ドーパミンドバドバシステムを維持することで近年影響力を増してきているなと思う
YouTube ショートは有名 YouTuber やアニメ公式アカウントなど制作能力の高いプロのクリエイターが制作しているコンテンツが多いこともあり、TikTok と比べると同じような形態ながらより既存のカルチャー寄りな (謎のダンス動画とかがあまりなく、広く受け入れられ、そしてコンテンツ自体の質が高い) ラインナップになっているのを感じる
私は TikTok のコンテンツが好みでない(正直に言って全く面白いと思えないし、低俗だとすら感じる)が、一方でそうしたコンテンツが面白く、同じ価値観を共有するユーザー間でのコミュニティも出来上がり、そういう世界が当たり前だと思っているユーザーも当然にいて、「何が良いコンテンツなのか」の価値観自体に既にかなり断絶がある
私は深夜アニメを演出意図や構図などを注視し、基本ながら見せず部屋を暗くして真剣に対峙して観ているタイプだが(とはいえ深夜アニメ視聴を始めた頃はそこまでアニメ筋を鍛えられていなかったので、視聴経験を重ねるにつれてようやくより深度のある鑑賞の仕方ができるようになったなと思う)、
ちょうどさっき開いたらドラえもんワンピースクレしんの画質ガッビガビの低品質な切り抜き動画が「感動するシーン10選!」とかいうので300K再生されていたりして、価値観の断絶に頭がクラっとしそうになるそういうファスト映画的な作品のセンセーショナルなシーンだけ雑に切り抜いたコンテンツ(それでも作品愛があればいいが、感じられないものも多い)に「感動しました!」とか純粋なコメントが付けられているのを見ると、人の価値基準とは何なのか考えさせられる
TikTok のコンテンツにはもちろんそれなりに手間が掛けられているものがあるが、短いのもあってこう感じ入るような作りの”深みのある”コンテンツがなく、タイパと Attention 最適化の末にこういう情念もないコンテンツだけになってしまったプラットフォームなのか…と感じずにはいられない
でもこれは結局私が「TikTok のコンテンツに触れずに生きてきた」からそう思うのであって、TikTok が日常の人たちにとっては(特にリアル友人と当たり前のように学生時代から TikTok コンテンツでワイワイしていた層にとっては)、コンテンツへの(ともすれば雑で浅い)そうした扱いが当たり前であり、両方の価値基準が異なるのだから分かり合うことは不可能なのではないかとすら思える
批判的思考をしてみると、私が持つ「プロ (上位 YouTuber が作った動画もプロに含まれる) が作ったクオリティの高い映画・ドラマ・アニメ・YouTube動画は心や教養を豊かにする一方、短くて「刺激」で報酬系を満たす TikTok 動画は低俗である」という価値観も結局のところ「何が上質なのか」の定義次第で180度変わるわけで、「冗長でなく数十秒程度と短くて感情や情感が端的に直情的に表現されていてすぐ消費できてしっかり面白いコンテンツこそが良質である」と定義されている人にとっては、まず同意できない価値観だろう
私は一応Z世代に入る人間だが、同世代でも IT 技術界隈寄りのリアル知り合いと、少し前に会った地元の同級生とでカルチャーの深い断絶があり、軽くショックを受けたのを思い出す
私はプログラマーなのでスマホより PC の方が得意だし PC を触る時間の方が遥かに長いけれど、世間的には圧倒的にスマホファーストの時代であるらしい そりゃ写真加工アプリもスマホだらけになるわけだわ…
ここまで読んだ人の中には『生成 AI コンテンツを好きになる訳ないだろ!』と感じる方もいるだろうし、私もどこまで生成 AI コンテンツを受け入れるかは自分でも実際にそうならないと分からんというのが正直な所だが、間違いなく「生成 AI 製でも自分によって良ければ (より具体的に、例えば R-18 なら「実用性」があれば) 良い」という層が出てきている事実がある
Twitter でも生成 AI (一部加筆してる人もいる) イラストを出してるアカウントが数十万単位のフォロワーを獲得している例をちらほらみるようになってきた
これも結局「価値観の二極化」「考え方の断絶/分断」みたいなところに繋がっていく
現在もレコメンドによるパーソナライズが既に行われていく中、生成 AI でユーザーに提供するコンテンツ自体をパーソナライズして提供できるようになっていくことで、人々の関心の多様化、細分化がより一層進むと考えられる
これは過去の歴史の流れを見れば明らかで、昔はコンテンツを届ける流通手段が限られていた & コンテンツ制作に多大な労力が掛かっていたから映画館・劇場・本などしかなかったのが、テレビや録画されたビデオテープ / CD / DVD の登場で庶民が楽しむコンテンツが増え、当然にコンテンツの供給・選択肢も増えていった
そしてインターネットの登場以降は爆発的にコンテンツが多様化したし、オタク文化もインターネットにより多様なコンテンツが許容されることになったが故の発展とも言えそう
そして YouTube という動画共有サイトの登場により、個人レベルでも大企業が作ったコンテンツに張り合えるレベルの反響を獲得し、さらに自分の興味関心に合わせた多様なコンテンツを、ユーザー自身が選び取れる時代になった
当然過去のコンテンツもなくなりはせず大半が残るので、今やアニメや映画作品なども含めコンテンツ飽和時代と呼ばれるくらいには、多様な関心に合わせたコンテンツが提供されている
今や TikTok やインスタ、さらには Mirrativ のようなより小さい個人小さくて濃いファンに特化したようなアプリも出てくる中で、既に多様な興味関心に応えるコンテンツがどんどん出てきている
ここに生成 AI 製のパーソナライズされたコンテンツが提供されると考えると、さらに興味関心の多様化・細分化が進むと考えるのは自明だろう
Suno や Udio などの音楽生成 AI が話題になっているが、人によって好みが千差万別な音楽こそ、レコメンド + 生成 AI による「自分にとって脳汁ドバドバ最高な曲を無限生成してくれる最高アプリ」の爆誕が容易に想像できる
誰しも「めちゃくちゃ好みの脳汁出る曲作ってくれるアーティストなのに長らく新曲できてないんだよね (あるいは既に解散 or 失踪 or 死去) …」という経験があるのではないでしょうか。私はあります…。
そんな中、自分が好みの曲調を高度なレコメンドアルゴリズムでまるで「察する」かのように既に理解しているアプリ/サービスが、自分にとって脳汁ドバドバ出るような刺さる曲を次々に AI で生成し、Spotify みたいな UX で再生できるとしたら…? 少なくとも私は月 $20 までなら契約する自信がある
もちろんあんまり好みでない曲を出してくるかもしれないけど、そこは TikTok 風の UI で自然と調整していけばいいわけで、そしてパーソナライズが完了すれば自分が好きな曲しか流れてこなくなる最高の状態
音楽ってどうしても何回も鬼リピしちゃうと飽きちゃいがちだけど、生成 AI であれば何回も聞いて飽きる前に、自分が好きそうな曲を無限に生成できる
音楽分野はもともと「人間が心地よい」と感じるメロディーやコードが限られているからか、大量のデータを学習さえすれば実用鑑賞に耐えうるクオリティのものが生成できることが、早い段階で Suno や Udio によって実証されている形
アーティストはアーティストである以上、特に売れるためにはある程度「広く浅く」にならざるを得ないが、生成 AI であればよりユーザーが個人的に好むメロディーの曲を、ユーザーが望む限り無限に供給できるようになる
もちろん「AI 生成できるとしてもこのバンドが生身で出す歌詞が好き」「このバンドのこの人が歌っているから好き」と考える人も出てくるはずで、そこも価値観の二極化の話につながっていく
音楽は今後ますます「曲」と言うアウトプット自体よりも「アーティストという人間」に関心が向くようになっていき、したがって生成 AI 楽曲では実現できない、バンドや歌手の生歌唱・生演奏はさらに価値を増していくだろうと思う
すでに Spotify などの音楽サブスクの登場で CD / 曲自体が売れる時代ではなくなっていて、高音質な音楽がいつでも気軽に聞ける時代だからこそ、「自分がいるこの場で演奏され生の音を全身で感じているんだ」という『生演奏』の価値が飛躍的に高まっている印象
コロナで一旦下火にはなったが、感染対策の緩和にともない色々な方面でライブやコンサートがかなり増えてきている印象
「人間が繰り出す生身のサウンド/歌詞が好き」な人は今後どんどんライブに参加するようになるだろうし、逆に「生成 AI 製でも(例えるならジェネリック医薬品的でも)自分にとって最高の曲なら問題ない」という人は心の内面に篭って生成 AI 楽曲を聴きまくり脳汁をブシャブシャさせる、そんな分断が発生していく予感がしている
このように「コンテンツ」そのもののクオリティが人間と AI で大差ないかそれ以上(無限に出せる物量で言えば既に AI が勝っている)になっていく中で、人間のクリエイターはますます「人間が自分の力で描いた」という点を付加価値に、職人化(極端な話、伝統工芸・人間国宝・無形文化財化)していくと考えられる
これも過去に沢山あった話で、工場で機械による大量生産ができるようになった現代では「一皿一皿熟練の陶芸職人によって丁寧に作られている」という事実こそが高い付加価値になっていて、ダイソーで110円で売ってる大量生産品の茶碗で「実務的には」満たせるにも関わらず、高級な有田焼とかの茶碗を買う人がそれなりにいらっしゃる
他にもミシンを使わず手で編まれたマフラーは、「手編み」という事実、ナラティブだけで大きな付加価値がつく
少しアナロジーの方向性は異なるが、現代において陸上で超高速で走れても実務的にはほとんど寄与しない(100年前から到底車のスピードに勝ててない)にも関わらずスポーツが人気を博しているのも、『自分と同じ人間が、人の限界に挑んで切磋琢磨している様子に感動するから』であって
例えば陸上で Tesla bot が爆速で走ってて1位取って感動するだろうか?あるいは陸上中継の映像自体が超リアルに生成 AI で人工的に生成されてたら一気に冷めるし観る気なくしそうのはなぜか?と逆説的に考えてみると、諸々見えてくる
今もロボコンとかはあるが、あれはロボット自体よりも、ロボットを開発したチーム内の「人間」同士のバトルだから、スポーツ同様にアツくなれるんだと思う
さらにアナロジーをやると、リュウジが再三言っている(私も同意します)通り「味の素・うまみ調味料を使ったほうが明らかに料理は美味しくなる」のに、それでも無化調をうたったラーメン屋さんはあちこちに存在して、実際私たちは「無化調でこの美味しさ!?すげえ!」と付加価値を感じるわけじゃないですか
そして未だに「うまみ調味料に頼って美味くするのはズルい、自力で頑張って料理して旨くすべきでしょ😤」って風潮が残ってる
これだけ類推すればわかる通り、人間は(機械の力をあまり借りず)自力でやり切ったこと、便利なものに頼らず縛りプレイでやったことに価値を感じる傾向があるし、それは昔も今も変わらない
人力車が実用的価値を失っても、「生身の人間が人力で運ぶこと」に付加価値があるから超高くても乗る人がいるのと同じ
「縛りプレイ」はかなり正鵠を射ていると思っていて、実際スーパーマリオを「ハテナブロックを一回も叩かずチビマリオだけで残機一回も減らさずに」という縛り付きでクリアしてたら感動するのも、便利なものに頼らずに自分自身の驚異的な実力でクリアする、その事実に人は物語性を感じて、感動するからに他ならない
…こうして考えると、今既にプロ級の実力を身につけているクリエイターはAI 技術に頼らず、むしろアナログで一発描きで美麗なイラストを描ける能力を持っていた方が今後付加価値として評価されて生き残りやすくなるんじゃないか、という結論になってしまう
例えばアナログの紙に一発描き & 爆速で超上手い絵を描けたり、水彩絵の具で全部手描き手塗りしてアニメ作ってる職人級アニメーターさんにめちゃくちゃ感動 & 尊敬するわけじゃないですか
もちろん「自分の好きなものを表現したい」が「手間はかけたくない」と文明の利器を使うのは全く問題ないとは思うけれど、結局そうして文明の利器を使いつつ人の手で作られたアウトプットも AI で一発ポン出ししたアウトプットとクオリティ上見分けがつかなくなっているという事実が既にあって、それならむしろアナログ絵の方が(物理的に存在しているし)価値が出てくるよね、みたいな
今後デジタル化と生成 AI コンテンツの普及が進むほど、物理的な紙に描かれたイラストの価値って下がらないどころか急激に上がっていくと思う
今でもアニメーターの生原画って全然売れると思うんだけど、なぜかあんまり売ってる例を見なく (中間成果物だからと捨ててることも多いらしい) て勿体ないなと思う
あと「職人化」はそれなりに中長期的なものですぐに来るとは限らないし、短期的な予想で考えると、先に中長期的な目線で考えるかでも考え方がまた変わってきそう
既にある流れではあるが、生成 AI コンテンツ普及後はなおさら「コンテンツそのものより、その作品を作った作者を好きになる」流れが加速するだろうし、「それでも人間が作ったコンテンツの方が良い」最大の理由に「このコンテンツを作った””人間””に魅力を感じているから」というのが上位に入ってくるだろうと思う
上でも書いた付加価値の話って NFT がまさにそうで、NFT 自体はただのブロックチェーンに刻まれたただのデータであり実データすら埋め込まれていない (格納できるデータ量が小さいらしく画像の URL しかいれられない) んだけど、それでも「パンクシー作の世界に一つしかない NFT を私が持っている」ということに多大な優越感を感じられる方もいらっしゃるわけで
実際現代アートって作品「そのもの」よりも、作品が提示する皮肉やメッセージ性を解釈した各々の人間の内面で「情緒的価値」が生まれ、情緒的価値を強く感じた人がお買い上げしていくものみたい
要は皆が同質の価値を見出していた「機能的価値」の時代から「情緒的価値」を求める時代になりつつあり、情緒的価値の価値基準は人それぞれ異なる(コンテンツを受け入れる人間のものさし次第)なので、当然人によって価値を見出すものは異なる
情緒的価値の情緒を出していくには製品に付随する感動的なストーリー、「無化調」「手作り」「人間国宝謹製」だとかの付加価値、あとは「SDGs 守ってます」「生産者の顔が見えます」「環境にやさしい」「フェアトレードやってます」とかが既にあって、これが生成 AI コンテンツの普及により、人間が作るコンテンツにおいてさらに加速していくだろう
さっきの細分化との話ともリンクする
こういう時代で一番困りそうなのが、今後出てくる「今人間のプロレベルの技術はないが人間のプロになりたい」人たち
結局プロになるまでには修練が必要だし、つよつよ職人にまでレベルが上がるまでの間も評価をある程度受け続けないとモチベや金銭的にやっていけないが、「人間のアウトプット」として評価されるには、クオリティとか諸々で何か突き抜けないと市場には評価されなくなる
おそらく陶芸職人の人たちも悩まされていそうだが、要は機械が陶器を大量生産できるようになる前から修練を重ねてきた熟練の職人は生き残れても、これからそれになろうとする人は「熟練職人」になるためのステップの階段がそのまま生成 AI コンテンツによりストーンと抜け落ちた形になるので、後継者を全然育成できない
現在職人や人間国宝と呼ばれるような類稀な技術を持つ人がどんどん減って後継者も育成できていない事例があるように(あるいは AGI の医療革新による長寿命化とかもあって?)、これから新規に人間としてやっていくのは難しくなるのかもしれない
とはいえ人間の創作が否定されているわけではないので、クオリティ的に拙くても、それでも自分のために作り続ける人は今後も居続けるだろう
おわりに
とりあえずザーッと書き出してみた。本当はちゃんと文章にまとめたかったのだが、箇条書きの方がどうにも書きやすいし階層構造にしやすくて…。
あとしっかり文章にするモチベが沸かない。結局こうやってモチベが続かなくて没になった記事が大量にあるので、Done is better than perfect の精神で行く。
もっと書けるトピックもあるんだけど、箇条書きですら既に7500字 (追記: 書き足したら9700字超えてしまった…) 近くいっているのでとりあえずこの辺で。
この記事が気に入ったらサポートをしてみませんか?