![見出し画像](https://assets.st-note.com/production/uploads/images/80700815/rectangle_large_type_2_9d000bb2b5d825df4ee352e052daa485.png?width=1200)
メディアコンテンツなる技術を妄想する
メディアコンテンツを妄想するに至る経緯
昨年まで新聞社でエンジニアとして働いていました。
それまで広告制作会社でグラフィックエンジニア(3Dモデルなどをリアルタイムに描画し、グラフィックを生成するプログラム作成)として働いていた環境と違い、新聞社では様々なニュース記事コンテンツが日々生成されのを目の辺りにしていました。
記者と一緒に伴走しながらデジタルコンテンツを作るという役職でしたが、現状は記者の記事を少し補うぐらいのことしかできないでいました。
なぜそうなるのか考えると、新聞社のコア事業であるテキストベースの記事作成の延長に映像やインタラクティブなものを使うデジタル技術が存在するからと考えていました。
そのような構造を根本的に変えるためにデジタルテクノロジーを中心にコンテンツを作成することが出来ないか考えるようになりました。
思考を巡らす中でメディアコンテンツという技術の着想に至りました。
新聞社は退職しましたが、メディアコンテンツというものをどう実現するか未だに妄想しています。
メディアコンテンツとは
メディアコンテンツとは様々なメディアをつなぐようなものです。しかし、中心はありません。テキスト、画像、データ、音声、映像、3Dなんでもアップすることができますが、どれかを絶対インプットしないといけないというわけではありません。
![](https://assets.st-note.com/img/1655241676169-rVJxYydAmt.png?width=1200)
テキストから音声を生成したり、映像も生成します。逆に、映像から音声を生成したり、テキストを生成します。様々な媒体やSNSに自動的に投稿できます。ワークフローは内部の機能として持っています。
ハブ同士は相互に結びついています。10年前に使った映像を使ったり、3Dモデルから必要な映像を自動で生成することも可能です。
ハブ内に入るデータが増えれば増えるほど、よりクオリティーの高い映像などを生成することができます。
例えば、note上で記事を書いたとします。メディアコンテンツでは書いた記事を音声メディアに適したコンテンツ量とフォーマットに変換し、書いた内容から関連する動画や静止画をもとに映像メディアに適した動画に変換します。
メディアコンテンツでは文字だけがインプットではなく、動画なども使えます。食事や旅の思い出の動画から文字ベースのデータや一部静止画を抽出し、ブログ記事を作成したり、書いた文字ベースのデータをもとにまとめ動画を作成したりします。
コンテンツ作成がコア技術となるので、APIをサービス化して様々なサービスのコンテンツ作成の一部で使われるものになるのかなと妄想しています。
注目してるコンテンツや技術
メディアコンテンツが生成できそうなコンテンツや使用できそうな技術はチェックしています。
![](https://assets.st-note.com/img/1655162787779-PJ6TprBY1l.png?width=1200)
Forbesの記事です。ほとんどすべての記事が音声ファイルとして聴くことができます。
AIで文字テキストが自動的に音声を生成し、文字と音声両方体験することが出来ます。メディアコンテンツの一機能としてこういう使われ方をすると妄想しています。
映像生成はドローンを飛ばすやネット上に上がってる画像や動画を使用することも考えられますが、リアルタイムでの3Dモデル生成とレンダリングの技術が熱いと思ってます。
親和性の高い技術として佐藤航陽さんがやろうとしてる衛星データからバーチャル世界を自動生成する技術は使い勝手が非常にいいのでは感じています。これによって、例えば、「家の近くで火事が起きてる」とつぶやいたら、それをニュース映像として生成することが可能になり、これまでカメラマン、記者など複数人で半日かけて取材していたものがいらなくなります。
衛星データからバーチャル空間に世界を自動生成するAIを作ってみた(動画は東京の一部地域の再現)。これからAIに全世界の3Dモデルを作らせて、誰でも無料で使えるように配布していく。
— 佐藤航陽 🌎 著書「世界2.0 メタバースの歩き方と創り方」 (@ka2aki86) May 31, 2021
非営利での研究になるけど、マトリックスやレディ・プレイヤー1の世界観を実現していきたい。 pic.twitter.com/HSovVzbkIw
先日nfiniteというスタートアップのバーチャル・フォトスタジオが1億ドルの出資を受けると発表がありました。
nfiniteはバーチャルフォトスタジオでECサイトの物品撮影を3Dモデルを使ってバーチャル上で行うサービスです。このあたりがAPI化されると一気に自動での映像作成は進むのではないかなと注目しています。
今後にむけて
メディアコンテンツをどこから始めるべきかというと、やはり文字を音声に自動変換して、音声ファイルを文字コンテンツと紐付けして対応付けを行う簡単なシステムから作成します。
技術的ハードルはありますが、メディアコンテンツはなんとか切り拓けたらと思います!
この記事が気に入ったらサポートをしてみませんか?