見出し画像

Midjourney:シネマティック・プロンプト、オーバー・ザ・ショルダーショットを極める

Midjourneyでシネマトグラフィー:オーバー・ザ・ショルダーショット(肩越しのショット)の作り方。

OTS(オーバー・ザ・ショルダー)ショットは、最も効果的で広く使われているビジュアルストーリーテリングのテクニックの1つで、映画制作者の標準的なツールです。

Midjourneyの最新モデルV5では、このようなショットを映画のような映像に使うことがより簡単にできるようになりました。その方法をご紹介します。

オーバー・ザ・ショルダーショットは何に使う?

主に2人の会話を描写するために使われます。(ただし、それだけに限らない):カメラは2人のうちの1人の後ろに位置し、2人の視点からシーンを捉え、2人の肩や頭の一部がピンぼけの前景に、2人の相手がフレームの真ん中に位置する。この手法は、2人の被写体のOTS視点を切り替えながら順次使用されることが多く、ダイナミックな相互作用を生み出し、会話や反応を効果的に伝えることができます。

Midjourneyでオーバー・ザ・ショルダーショットを作成する方法

Midjourney V4の頃は、旧モデルにV5のような強いフォトリアリズムの傾向がなかったため、OTSショットを実現するためには、もっと多くの障害がありました。では、さっそくやってみましょう。

冒頭で、シーンやキャラクターを設定します。

cinematic shot, two women in a hotel lobby scene --ar 16:9 --seed 4000
筆者がMidjourneyで作成

シーンとキャラクターが決まったところで、希望のショットサイズに飛び込んでみましょう。

オーバー・ザ・ショルダーショットの撮影では、「クローズアップ」にする必要があります。

これをプロンプトに加えれば、これから扱う問題がすぐにわかります:

cinematic close-up shot, two women having a conversation, hotel lobby scene --ar 16:9 --seed 4000
筆者がMidjourneyで作成

画像1、2、4は、目指す会話シーンにマッチしていません。 一方、画像3はほぼ出来上がっている。

MidjourneyでAI画像を作成する場合、このような問題は非常に多い。アルゴリズムは、単語だけの狭い意味だけでなく、単語の意味合いを考慮するという意味で、全体的に動作するものである。

この場合、「ホテルのロビーにいる人」という意味場は、私たちがアップになっていないときに、2人の女性が会話している様子を表現しました。なぜなら、統計的に、ロビーではほとんどの人が会話しているように見えるからです。

クローズアップでは、「会話している」はモデル(画像3)の選択肢のひとつに過ぎず、その他に「並んで立っている」「何かを見ている」などがあります。そこで「会話をしている」というフレーズを使って、同時に2つのことを達成させます:

  • オーバー・ザ・ショルダーショットの撮影のために、キャラクターを正しい位置にキープする

  • クローズアップする際のオーバー・ザ・ショルダーショット撮影を容易にする

完璧を期すために、もう一度やり直します:

cinematic shot, two women having a conversation, hotel lobby scene --ar 16:9 --seed 4000
筆者がMidjourneyで作成

今度はクローズアップにしてみます。

cinematic close-up shot, two women having a conversation, hotel lobby scene --ar 16:9 --seed 4000
筆者がMidjourneyで作成

これで、初期グリッドの4つの画像はすべて正しい方向に進んでいることになります。

一つ重要なことを付け加えると、Midjourney V4ではショットタイプをプロンプトの最後に置いていましたが、V5では常にプレフィックスに含めるようにしています。V5では、ショットタイプをプロンプトの末尾に置くと、余計な問題が発生します。

この例を見てください。"close-up "を末尾につけています:

cinematic shot, two women having a conversation, hotel lobby scene, close-up shot --ar 16:9 --seed 4000
筆者がMidjourneyで作成

クローズアップはしません。

これは、Midjourneyが自然言語を理解することに磨きをかけた影響である可能性が非常に高いです。よく誤解されることですが、Midjourneyが自然言語しか理解できなくなったかのようです。カンマ区切りのプロンプトもまだ理解できますし、場合によってはより便利かもしれませんが、いつ、どのプロンプトを使うべきかを知っておく必要があります。

また、V5のフォトリアリズムの傾向はとても参考になりますが、映画的な用語の使用に取って代わるものではありません。

例えば、シネマティックプリフィックスを全く使用しない場合:

close-up shot, two women having a conversation, hotel lobby scene --ar 16:9 --seed 4000

すると、元のグリッドがさらに異なってしまい、目的にすらたどり着けません。

筆者がMidjourneyで作成

では、オーバー・ザ・ショルダーショットの撮影に戻ります。

cinematic close-up shot, two women having a conversation, hotel lobby scene --ar 16:9 --seed 4000
筆者がMidjourneyで作成

初期グリッドの4枚の画像は、すべて正しい道をたどっていました。
しかし、何が足りないのでしょうか?

画像4を見ていただくと、他の3つよりもオーバー・ザ・ショルダーショットの美学に近いとご納得いただけるかもしれませんね。

どうしてですか?

他の画像よりも「接写」に近いためと被写界深度を具体的に利用することができます。
ひとつひとつ検証していきましょう。まず、求めている効果を強調するために「被写界深度の浅さ」を追加します。

cinematic close-up shot, two women having a conversation, hotel lobby scene,
shallow depth of field --ar 16:9 --seed 4000
筆者がMidjourneyで作成

次に、クローズアップショットを誇張して、その重要性を強調しています。興味深いことに、V5は常にワンショットサイズビギンドになっているようです(「クローズアップ」はミディアムショットに、「極端なクローズアップ」はクローズアップになる傾向がある)。

cinematic extreme close-up shot, two women having a conversation, hotel lobby scene --ar 16:9 --seed 4000
筆者がMidjourneyで作成

最後に、この2つを組み合わせることで、初期グリッドのすべての画像でオーバー・ザ・ショルダーショットの美観を得ることができます。

cinematic extreme close-up shot, two women having a conversation, hotel lobby scene, depth of field --ar 16:9 --seed 4000
筆者がMidjourneyで作成

会話ではないシチュエーションはどうする?また、このようなものをより確実に動作させることはできるのでしょうか:

cinematic over-the-shoulder shot, a man stealing bread in a rectangular shape in a bakery, depth of field --ar 16:9 --seed 4000
筆者がMidjourneyで作成

いかがでしたでしょうか。

Midjourneyって奥が深い…いろんな写真が本当に生成できますね。

この記事を楽しんでいただけたなら幸いです。ではまた!

この記事が気に入ったらサポートをしてみませんか?