見出し画像

OpenAIの動画生成AI「Sora」の映像は絶対に見ておいたほうがいい

今でも生成AIツールの中で群を抜いて使われているのはOpenAIが提供しているGPTです。(同社のChatGPT以外にもMicrosoftのCopilotも)

定期的に生成AIの調査を行っている団体によると、下記のように圧倒的なシェアです。

flexOS公式サイト

そんなOpenAIが先日、動画生成AI「Sora」の発表を行い、そのサンプル動画が衝撃的なので紹介させてください。

といいますか、ぜひ動画だけでも見てください。下記よりすべて見ることができます。

まず、名前の通りテキスト指示によって動画を生成します。投稿時点では技術詳細は明かしていませんが、「Transformer」と「拡散モデル」をベースにしているようです。初見の方のために、関係性だけ図示しておきます。
昔はこういったアルゴリズムの学習も重要でしたが、もはや技術がインフラ化しているので、ふ〰んぐらいでいいかなと思います。

Transformerと拡張モデルの関係性

動画生成AI自体は他製品がいくつかあり、私も試したことはあったのですが、まだ数秒程度で精度もいまいちなものが(触る限り)多かったです。

上記サイトから早速いくつか紹介します。

まず、プロンプトはこちら。
"A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about."

で、その動画がこちら。クリックで視聴できます。(見れない方は上記公式サイトから)

OpenAI Soraサイト

なんと上記のプロンプトで60秒もの動画を生成しています。日本が風景なので若干文字化けが気になりますが、個人的には十分なクオリティです。

で、もっとびっくりしたのが動画編集機能です。今でも静止画はDall-E3である程度静止画像編集は可能ですが、その動画版です。

これも同サイトよりお気に入りのモノを載せておきます。

まずこの二つの動画を見てください。

そして、この2つの動画を合成することができます。その結果がこちらです。繰り返しですが動画でご覧ください。

ドローンが蝶に滑らかに変身します。これ見たとき、おぉ、と声をあげてしまいました。

このSora、現時点ではユーザ利用時期は未定です。
こういった動画をみると、フェイク動画への危惧が高まるかもしれません。

OpenAIとしては、動画にメタ情報(要は出所)を埋め込むなりして対応しようとしています。

良くも悪くもリリースされたら相当話題を呼ぶことは間違いないです。

今からこの技術が出たときのことを想像して備えようと思います。

この記事が気に入ったらサポートをしてみませんか?