見出し画像

なんだか物凄そうな静止画 ⇒ 動画生成サイト!(Runway)

一連の公開待ち記事は現時点で数件あります(ブログと並行公開のため
1 記事当たり2 ~ 3 日の間隔を置いています)が、特報的な汎用情報
なので、先に記事化して公開します。


ローカルPC のStable Diffusion Web UI (AUTOMATIC1111 版)の
拡張機能、AnimateDiff での動画にそろそろ限界を感じていました。

どうにもガタガタが止まらないのと、RTX4060 搭載(GPU VRAM 8GB)
のノートPC では640 × 400 pixels 程度で48 コマほどの動画生成
(1秒当たりのコマ数を調整出来るので、再生は1秒から48秒まで可変)
が出来るものの、プロンプト指定がどうであれ、人物像では顔のアップ
が多く、動きもガタガタで、ハードウエアを拡充しても、これがもっと
多いコマになったところで鑑賞上羨ましい状況には到底ならない感じ
がしていたのでした。

例えば静止画の描画ではここまで美しさを追求できた同じプロンプトで…。

((upper body)), ((( wearing gray and black nano-suits)))+++, (wide hip:0.7, large breasts:0.8, perfect slender young girl body) ,Perfectly glossy skin ,25 yo mature girl, , picture of a vivid, (masterpiece:1.2),(extremely detailed),(8k:1.1),(perfect lighting,best quality,highres,original),(realistic photography:1.4) ,high detailed skin,shaded face, soft lighting, (small face),RAW, ultra highres, pores visible, , shiny_and_glossy_skin, asian beauty, (gorgeous beautiful 20 years old asian girl), ((best detailed slender body)), (asian idol, asian beauty, asian mixed), (complex, Machine background ,spaceship outdoors background, Mecha Transport parts:1.2), (dark and foggy environment:1.1), ((heavy fog environment:1.1)), (battlefield behind:1.2),

Stable Diffusion Web UI (AUTOMATIC1111 版)での人物画

こんな使えない動きの粗い動画も多数出て来ます。

同じプロンプトでのStable Diffusion Web UI (AUTOMATIC1111 版)での動画

まだメカ画では時折ましな仕上がりもありましたが…。

(Realistic:1.5) (masterpiece) ((1 spacecraft)), 1980s (style), black background, explosion, scenery, retro artstyle, grey background, planet, ship, mountain, city, weapon, flying, robot, battleship, military, cloudy sky, fighter jet, from above, grey background,

このプロンプトで静止画では、こんな宇宙船バトルシーンを描いてくれて
いました。1980 年代スタイルの宇宙船だそう。
3 流SF ファンタジー映画「STAR WARS」スタイルでしょうか。

Stable Diffusion Web UI (AUTOMATIC1111 版)でのメカ画

AnimateDiff での同じスクリプトでの動画は人物画よりは幾分ましに
仕上げてくれてむしろ驚くほどではありました。

同じプロンプトでのStable Diffusion Web UI (AUTOMATIC1111 版)でのメカ動画 (01)
同じプロンプトでのStable Diffusion Web UI (AUTOMATIC1111 版)でのメカ動画 (02)

そのため最近ではLeonardo.Ai の簡易静止画生成(Image to Motion)
を使って4 秒の動画を生成させることをルーチン化していました。

以上のような経緯があって、Leonardo.Ai の簡易動画生成が現時点の
4秒固定から、8 秒や16 秒になれば有償契約しても良いかも、とさえ
考えていました。

しかし同じ技術が世の中に独立して存在していないか、調べることに
しました。

ありました。候補となるサイトは4つほど見つかりましたが、まず
Runway というサイトを試してみました。
生成された動画の右下端のサイトロゴもあまり目立たないので、
まず実行候補としました。(他の候補中には文字表示のもある)

Text to Image、Image to Motion、その両方を併用するサービスを無償利用
が出来ますが、1日あたりの利用ポイント残数と利用残秒数表示の関連が
現時点では分かっておらず、翌日、またポイントが復活するのか(無償契約
の単位が「日」なのか「月」なのか)も分かっていませんが、とりあえず
試してみました。

画面右上には69 秒が残っていて、1 秒に5 クレジットが使われるので、
まだ345 クレジットが残っているとの内容が「( i )」を押すと
出て来ましたが、それが月当たりの数値なのか、日当たりの数値
なのか現時点では分かりません。明日になれば分かるでしょう。
(有償契約は全て月当たりのクレジット数でしたが、Leonardo.Ai や
Tensol.Art も無償使用のみが日当たりのポイント提供でした。)

Text to Image、Image to Motion の両方を併用するサービスで
「Generate 4s」を試してみました。

Text to Image、Image to Motion の両方を併用するサービス (01)

最初はもやっとしてましたが、再生解像度を720p にしましたら、
はっきりしました。無償契約では720p が最大解像度のようです。

無償使用では4 秒単位で最大16 秒まで拡張が可能のようです。
画面上方と右下端の「Expand 4s」を押して拡張しました。

Text to Image、Image to Motion の両方を併用するサービス (02)

再生解像度を720p にしておくと、4 秒ごとにシャープさが徐々に
甘くなるのを幾分避けられるようです。
驚くことに、4 秒ごとの延長箇所のつなぎ目がスムーズに連続して
いました。

1 シーン8 秒でも4 秒の素材よりストーリーを持たせた動画の中
では使い出があります。

ますますRTX4090 グラフィックボードへの羨望は薄れました。
今の環境で充分です。
(搭載ノートPC が最近60 万円弱で出ましたね。デスクトップ機への
ボード単品は30 万円くらいにはなりましたが。)

有償契約をしてでも使って行きたいのは、このサイトですかね….。

というところで記事を閉じようとしました。
最後に冒頭の人物画とプロンプトで動画化を試みました。
ローカル描画ではメカ画はそこそこまともに描画出来ていたので
人物画のほうがローカル描画との差は出るかと考えました。

ところが….。

Content Policy抵触の警告が….。

Content Policy を参照して見ましたら….。

> ランウェイは、ヌード、暴力、性的に露骨なコンテンツ、その他の
> 攻撃的な題材を含む、またはそれらに言及するリクエストおよび
> アウトプットを管理します。
> このリストはすべてを網羅するものではありません。ランウェイは、
> コンテンツモデレーションに対するアプローチを随時更新する権利を
> 留保します。違反が繰り返された場合(フラグが付けられたインプット
> の再提出を何度も試みた場合を含む)、アカウントの停止につながる
> 可能性があります。

どうやらNSFW 画だと判定されたようです(呆)。
既に2 回描画を試みたので、アカウント削除対象になっているかも
しれません。

Tensol.Art ではかなりNSFW 表現になってもお咎めなしで、Leonardo.Ai
とmage.Space ではプロンプト実行時にエラーとなり、結果的にNSFW
相当だろう、とこちらが思うほどの出力でも通してしまうのに比べて、
かなり穏やかでないポリシーです。

それでは私に限ってはやっぱり使えませんかねえ…。
nano-suits の表面が滑らか過ぎるのが悪いのか、プロンプトに
battlefield が混じっているのが暴力的と解釈されたのか、
別の黒っぽいnano-suits の画とプロンプトの一部を割愛(あまり入力
出来る文字数は無償使用では多くないみたいでした)して実行
しましたが、結果は変わらずでした。

別の黒っぽいnano-suits の画で再度試すもダメでした。

無難そうな既出の画像とプロンプトを使ってみますと…。

Tensol.Art のXXMix_9realisticSDXL - v1 を使った人物画

4 秒延長での8 秒の動画を生成しましたが、最初から柔らかい表情が
やや違う印象で近づくにつれて、その印象の乖離は大きくなって
行きました。しかし4 秒でのつなぎ目も感じさせず、オリジナルから
補完でここまで動画生成されるのはやはり驚きです。

サイバー女子隊員はLeonardo.Ai で動画化させましょうか…。
または他の候補サイトを試してみましょうか。
最後にちょっと(大きな)ケチがつきましたが、普通の(?)
使い方では問題なく便利に使えそうですかね。

しかし別件になりますが、1 分以内の短い動画が強制的にショート動画
にされて全画面表示が出来なくなっていた一時期の改悪は解消と
なったのか、横長画面が幸いしたのか、今回の素材は全て通常動画として
YouTube に登録されました。そのほうが断然使い易いです。


ご覧いただきありがとうございます。







この記事が参加している募集

#AIとやってみた

27,676件

この記事が気に入ったらサポートをしてみませんか?