見出し画像

OpenAI、テキストからビデオを作成するAI:Soraがぶっちぎりで凄い!

Soraは、テキスト指示から現実的で想像力豊かなシーンを作成できるAIモデルです。Soraは、ユーザーのプロンプトに忠実で視覚品質を保ちながら、最大1分間のビデオを生成できます。このモデルは、物理的な世界の動きを理解しシミュレートすることを目指しており、実世界の相互作用を必要とする問題を解決するのに役立つモデルのトレーニングが目標です。現在、Soraはリスクや害の重要な領域を評価するためにレッドチームに提供されており、視覚芸術家、デザイナー、映画製作者からのフィードバックを得るためにアクセスが許可されています。

OpenAI社長のグレッグ・ブロックマンもXにポストしています。

サム・アルトマンも続いて投稿しました。ま、魔法の世紀です。

あなたは、魔法使いのサミーです


Soraがどれほど凄いのか比較動画

公式でも説明があるように、自然現象の物理演算を用いているため実写映像さながらの自然さになっています。最高峰と言われてきたRunway Gen-2との比較を上げています。描画技術は遜色ないのですが、動いている状態を見ると一目瞭然です。

他の3つの動画生成AIとの比較動画も上がっています。

OpenAI公式ポストの日本の風景

これは、Soraと言う名前が日本語の「空」から来ていると見ていいのでしょうか?公式のポストには日本の美しい冬景色が添付されています。

テキストからビデオへの変換モデルである Sora を紹介します。 Sora は、非常に詳細なシーン、複雑なカメラの動き、鮮やかな感情を持つ複数のキャラクターをフィーチャーした最大 60 秒のビデオを作成できます。 https://openai.com/sora プロンプト:「美しい雪の東京の街は賑わっています。カメラはにぎやかな街路を移動し、美しい雪の天気を楽しんだり、近くの屋台で買い物をしたりする数人の人々を追っています。華やかな桜の花びらが雪の結晶とともに風に乗って飛んでいきます。」

東京なら神田川なのか荒川なのか、でも風景的には京都の鴨川だよなと思ってしまいました。この謎の看板のカタカナはなんでしょうね?早く日本語が書けるようになってほしいです。

こちらのインドのニュースでは、「Soraは日本語の空から来ている」と書いてあるのでやはり、そうみたいです。

Soraはいつから一般公開される?

公式の発表によると、OpenAI の製品で Sora を利用できるようにする前に、いくつかの重要な安全措置を講じる予定だそうです。OpenAIは、モデルを敵対的にテストしているレッド チーム (誤った情報、憎悪に満ちたコンテンツ、偏見などの分野の専門家) と協力して一般公開に向けて準備を進めています。

SoraはChatGPTに組み込まれるのか?

現在のところ、GPT-4が利用できるツールにはSoraは含まれていません。Soraは、特定のテストフェーズや限定的なアクセスを提供している可能性があり、OpenAIの提供する一般公開前のプロダクトとして位置づけられています。Soraの利用やアクセス方法については、OpenAIの公式情報や公表されている資料を参照する必要があります。

ジム・ファン氏によるSoraの解説

OpenAI Sora が DALLE のようなクリエイティブなおもちゃだと思っているなら、...考え直してください。

Sora はデータ駆動型の物理エンジンです。それは、現実または幻想的なさまざまな世界のシミュレーションです。シミュレーターは、複雑なレンダリング、「直感的な」物理学、長期的な推論、および意味論的な基礎を、すべてノイズ除去と勾配計算によって学習します。ソラが Unreal Engine 5 を使用して大量の合成データでトレーニングされても驚かないでしょう。それは間違いありません。

次のビデオを詳しく見てみましょう。プロンプト: 「一杯のコーヒーの中で航行する 2 隻の海賊船のフォトリアリスティックなクローズアップ ビデオ。」- シミュレーターは、異なる装飾を施した海賊船という 2 つの精巧な 3D アセットをインスタンス化します。Sora は潜在空間で暗黙的に text-to-3D を解決する必要があります。- 3D オブジェクトは、航行し、互いの進路を避けながら、一貫してアニメーション化されます。- コーヒーの流体力学、船の周囲に形成される泡も。流体シミュレーションはコンピュータ グラフィックスのサブ分野全体であり、従来は非常に複雑なアルゴリズムと方程式が必要でした。- フォトリアリズム。レイトレーシングによるレンダリングにほぼ似ています。- シミュレーターは、海と比較してカップのサイズが小さいことを考慮し、「極小」の雰囲気を与えるためにチルトシフト写真を適用します。- シーンのセマンティクスは現実世界には存在しませんが、エンジンは依然として私たちが期待する正しい物理ルールを実装しています。次に、モダリティとコンディショニングをさらに追加すると、すべての手作業で設計されたグラフィックス パイプラインを置き換える完全なデータ駆動型 UE が完成します。

あらゆる種類のスタートアップを爆破

比較動画で確認できるように、Soraの精度がぶっちぎりで高いため他の動画生成AIスタートアップを全て壊すと言う投稿が相次いています。

OpenAI 機能のリリースは多くのスタートアップにとって消滅イベントである。驚くべき驚くべき実行

今日はAI愛好家にとってのクリスマス

最初は 10M コンテキストを備えた Google、そして現在は OpenAI Sora です。今日は AI 愛好家にとってのクリスマスです

くそー…2024年はもう面白くなり始めてる

AGIに近づいた

AGIに1日近づいた

OpenAIの社長による開発者の紹介

率いるチームの素晴らしい仕事
@billpeeb
@_tim_brooks
@model_mechanic.

世界をむしばむソフトウェア

新聞、メディア、そして今度はハリウッド。世界を蝕むソフトウェア。チーム、おめでとうございます。よくやった、限界を押し広げました..!

彼らはグーグルに一日でも注目を集めさせないだろう

このままでは、OpenAI は歴史を書き換えつつあります…わぁ。

ゲームチェンジャー!

クソ野郎。狂ってる!!!

AI が世界を席巻しました。

なんて楽しい仕事なんだろう

本当に。採用される頭脳さえあればこんな楽しそうな会社はありませんよ。

現実がSoraの作りだす世界を追う事になるのか?

これは、

プロンプト: 2056 年のナイジェリア、ラゴスの人々を映した美しい自家製ビデオ。携帯電話のカメラで撮影されました。

と言うプロンプトで生成された動画ですが、今後人々は自分のデザイヤーを映像にし現実がそれを追いかける様になるのでしょうか?日本の2056年は見たくないですね。

見た事もない映像を作り出す

Soraはリアリティのある空想世界を作り出せますね。

サムにSoraの「生成プロンプト」依頼が始まってる

サム・アルトマンが人々の要望に応えて生成しています。

なんだこのリアルさは。どう考えて現実にいるだろう。このおばあちゃん。

これはすごい!子供の頃に描いていた2024年はこんな世界だった!!

私たちと働きませんか? by サム・アルトマン

いやはやいやはやいはやは、OpenAIの採用条件に見合う頭脳さえ持ってれば筆者だって参加したいですよ。もちろん。世界中の何人が採用条件をくりあできるんですかね?!?!

OpenAIの公開するSora生成のビデオ

プロンプト: 「赤いウールのニット バイク ヘルメットをかぶった 30 歳の宇宙飛行士の冒険をフィーチャーした映画予告編。青い空、塩の砂漠、映画のようなスタイル、35 mm フィルムで撮影、鮮やかな色。」

プロンプト: 「色とりどりの魚や海洋生物があふれるサンゴ礁を、豪華に表現されたペーパークラフトの世界。」

このビデオはSoraによって作成されました

それがOpenAIによる新しいモデルです。これまでに作成された最も高度なテキストからビデオへのツール。 ここでビデオを共有します。まったく正気の沙汰ではない。 プロンプト: このカンムリバトのクローズ アップ ショットは、その印象的な青い羽と赤い胸を示しています。冠は繊細なレースの羽でできており、目は印象的な赤い色です。鳥の頭はわずかに横に傾いており、堂々とした印象を与えます。背景をぼかし、鳥の印象的な姿を際立たせています。

>このページのすべてのビデオは、修正なしで Sora によって直接生成されました。>プロンプト: ゴールドラッシュ時のカリフォルニアの歴史的な映像。アーチファクトが非常に少なく、スムーズな時間的一貫性。まだ技術文書を待っています

映画監督は死んだ
OpenAI は sora をリリースしました テキストからビデオへ |テキストからムービーへ 以下にワイルドな例を示します。

マンモスだ!

OpenAIの新しい Text-to-Video モデル。ソラは私たちが世界を視覚化する方法を変えます。

画質が何故DALL-E3より優れているのか?

Sora からのビデオは、Dall·E 3 によって生成された静止画像よりも優れているのはなぜですか?

これは素晴らしいです まず最初に気づくのは、これが DALL-E 4 世代よりもはるかに優れているということです これは、もうすぐ DALL-E 5 が登場することを意味しますか?

これは、本当におもいます。しかしながらDALL-E3にはこのような写真を生成する能力はあるのですが写真の生成を制限されています。肖像権などにひっかかった画像を生成しないよう、現在は、細心の注意が払われています。

OpenAIは技術の安全性と倫理的な使用を非常に重視しており、公にアクセス可能なサービスでは常にこれらのガイドラインに従うよう努めています。

DALL-E 3が生成したリアルな写真は、多くの人にとって非常に魅力的でした。肖像権や著作権の問題が解決され、再びそのような高品質な画像を安全に利用できるようになる日が来ることを筆者も希望しています。技術の発展とともに、これらの課題に対する解決策も見つかるまでは、一般公開されるSoraは、画質のあらいDALL-E3で映像生成をする事になるでしょう。

他の動画生成AIとの比較

どうやら、他のAIとはお話にならないほどクオリティがぶっちぎりで高いようです。

この生成動画は私の脳を破壊しました

たしかに。こんなリアルな発掘現場に魔法のFRPの椅子が発見されたなんて。

イーロン・マスクも参戦

ドージコインのアカウントの、「非営利のオープンソース会社を営利企業に変える男」と言うプロンプト依頼を共有しています。

ANNの報道

分かりやすくニュースで解説していますので、共有しておきます。

筆者も待ちきれません

GPT-4との会話がこんな事になっています。

この記事が気に入ったらサポートをしてみませんか?