見出し画像

OpenAIのSoraはすごそう、でも使いこなすのは難しそう


すごそう

OpenAIは2024年12月9日(現地時間)動画生成AI「Sora」の一般提供を開始しました。
同年2月に公開したデモ動画の中で使われているプロンプトを試してみました。

"A litter of golden retriever puppies playing in the snow. their heads pop out of the snow"

(ゴールデンレトリバーの子犬が雪の中で遊んでいる。雪から頭が飛び出している)

2つの動画を生成してもらい、いい出来の方です。
もう1つは不自然な場所からレトリバーが飛び出したりしました。
これはクオリティが高いと思います。

難しそう

使いこなしが難しそうと感じたのはPresets
特定のエフェクトを適用した動画を生成します。

画像

例えば以下のプロンプトを利用して、各Presetsを使用してみます。

A 3DCG depiction of a primitive-shaped iron robot with a raw, metallic texture. The robot is mid-stride, running gracefully through a futuristic, open landscape. Its body features simple geometric forms, like cubes and cylinders, with a rugged, unpolished iron surface that reflects light subtly. The setting combines natural and futuristic elements, with glowing accents and a dynamic environment that emphasizes the motion and sturdy simplicity of the iron robot.

(生々しい金属の質感を持つ、原始的な形をした鉄のロボットを3DCGで描いた作品。ロボットは中腰で、近未来的な開けた風景の中を優雅に走っている。ボディは立方体や円柱のようなシンプルな幾何学的フォルムで、表面はゴツゴツとした磨かれていない鉄で、光を微妙に反射する。光り輝くアクセントとダイナミックな環境が、鉄製ロボットの動きと頑丈でシンプルさを強調している。)

こうなりそう?

ちなみに、ChatGPT(Plus)で生成した画像がこちら。

画像

Luma Dream Machineで生成した例がこちら。

KLINGで生成した例がこちら。

やっぱり使いこなすのが難しそう

Soraで試したところ、上記の結果と印象の違い、最初に紹介したゴールデンレトリバーの動画のようなインパクトは感じませんでした。

Presetsを使うと、微妙な感じです。
Presetsに適したプロンプトが必要なようです。

Presets : None(デフォルト)

SoraPresetsのデフォルトのNoneではこんな感じ。

Presets : Balloon World

Presets : Stop Motion

Presets : Archival(記録映像的な、という意味のようです)

Presets : Film Noir(フィルム・ノワール)

Presets : Cardboard & Papercraft(ダンボール&ペーパークラフト)

Presetsは装備されているからには、有効な使い方はありそうです。
ただ、相性のよいプロンプトを探すのに試行錯誤が必要だと思いました。

いいなと思ったら応援しよう!