見出し画像

Leonardo AIの新モデルとエレメント [ PhotoReal V2 & Dragon Scales ]

はじめに

前回の、Upscaler関連の投稿から一週間がたってしまいました。現在のメインマシンのMacBookAirM2が不調で、無線LANは接続してるのに、インターネットに接続できないという状況が続き、TimeMachineによるリカバリー等、色々トライをして時間が経過。 結局、ウィルスチェックアプリが原因でした、ということで、やっと復活、でした。

などと、もたもたしている間に、生成AI界隈では、大激震。OpenAI vs Googleで、SoraとGemini1.5Proが、それぞれ発表されました。

Sora

特に、日本国内では、Soraについて色んな人がコメントをのせています。
なかでも、たとえば、この、にゃんたさんのチャネルの紹介が、技術的な理解力に基づきポイントをついてわかりやすいように思いました。

にゃんたのAI実践チャンネル
にゃんたのAI実践チャンネル

OpenAI最新!動画生成AIのSoraが作った動画が凄いhttps://youtu.be/or3FzIAjeYc

ともかく、Soraの場合、動画をみると、一発で、その凄さがわかるので説得力があります。

Runwayとかで、頑張って11秒(3+4+4)がこれまでの最長だったのが、あっさりと1分。そしてその画質の良さと、内容の意味的な質の高さ、などなど、レベルが違います。本当にすごいです。

生成動画と、リアルな動画との区別がつかない世界は、もう見え始めているように感じます。
犯罪用途を考えると、本当に怖い世界が垣間見えます。
攻殻機動隊の世界に生きる人達のような、常識、が必要な世界が見え始めていると思います。この過渡期の時代、どれぐらいの人がついていけるでしょうか。

Gemini 1.5Pro

これで、Googleの発表が少し霞んでしまっていますが、、、
Gemini1.5Proについては、Googleのブログに記載があります。
次世代モデル、 Gemini 1.5 を発表

こちらは、128,000 トークンが標準で入力に使え、さらに100万トークンの試用開始、ということで、長い情報の一括処理はもとより、その中に学習要素をいれることで、専門性を向上させる、などということにも対応できます。

ただ、こちらは、やや内容の理解が必要なせいか、You Tubeでは、英語版のみで、日本語で解説しているのはほとんど無いようです。こちらも、応用事例とともに、ジワっと評判になることでしょう。

ちなみに、RAGは、もういらない、とかおっしゃる方々が既に登場しています。

新しいElement、Dragon Scale

さて、これらに比べれば、かなり地味な印象もありますが、この一週間で、LeonardoAIに新たなElementが追加されています。
Dragon Scaleという名称です。

ただ、例によって、まだ下記には、まだ記載されていません。
All Collections>Feature releasesElements
なお、Cybertechは、すでに追記されています。

今回は、最近リリースされた、Photo Real V2と組み合わせた場合の画像などを試してみます。

新Elementと新モデルについて

新しいElementのDragon Scaleと、Cybertechは、ともに、XL系のモデル用のElementです。
従って、新たにXL系のモデルがベースとなりV2となったPhoto Real V2に適用できます。

Celebrate the Year of the Dragon with fierce dragon scales. Looks best with Leonardo Vision XL.
ドラゴンの年を激しいドラゴンの鱗で祝おう。Leonardo Vision XLとの相性が最高です。

Dragon Scaleは、今年の干支である辰(龍)年の旧正月を祝ってリリースした、とLeonardoAIのXにコメントがあります。

どうやら、龍の鱗が付加されるようです。

それでは、画像を生成してみます。

Photo Real V2 ✕ Dragon Scale (+Cybertech )

まずは、白い魔女。

プロンプトは、こうです。

プロンプト

In a dimly lit forest, the graceful and wise white witch delicately held her ornate magic wand, adorned with intricate carvings and shimmering gems that sparkled under the moonlight, channeling her mystical abilities. This breathtaking scene, captured vividly in a mesmerizing painting, skillfully portrays the ethereal beauty of the noble white witch and the enchantment she wields. The artist's remarkable attention to detail immerses viewers in the enchanting ambiance of the dark woodland, evoking a sense of awe and wonder.
薄暗い森の中、優雅で賢明な白い魔女は、彫刻が施され、月明かりの下できらめく宝石が飾られた華麗な魔法の杖を繊細に持って、その神秘的な能力を引き出していました。この息を呑むような光景は、魅惑的な絵画に鮮やかに捉えられ、高貴な白い魔女の幻想的な美しさと彼女が操る魔法を巧みに描いています。アーティストの注目すべき細部への注意は、視聴者を暗い森の魅惑的な雰囲気に引き込み、畏怖と驚嘆の感情を喚起します。

例によって、長い。さて、画像は、どうでしょうか。

生成画像の例

早速、画像を生成します。
まずは、オリジナル、の、Alchemy Upscale(Low, normal)処理バージョン。

Alchemy Upscale(Low, normal)

AlchemyV2:on
Preset: Bokeh
PhotoReal v2: On
Model:  Leonardo Kino XL

V2で初登場の、Bokehは、なかなかいい感じの画像を生成します。

そして、次に、ElementのCybertechを足して、Alchemy Upscale(Low, smooth)処理してみます。

Alchemy Upscale(Low, Smooth)

AlchemyV2:on
Preset: Bokeh
PhotoReal v2: On
Model:  Leonardo Kino XL
Cybertech: 0.40

さて、今回のお題のDragon Scaleです。縦長の例を示します。

Alchemy Upscale(Low, smooth)

AlchemyV2:on
Preset:Vibrant
PhotoReal v2:On
Model:Leonardo Kino XL
Dragon Scales:1.20

コスチュームとして自然です。AlchemyUpscaleをかけると、やや若返るようです。落ち着いた白魔女としては、Originalの方が、いい雰囲気だったりもします。

また、場合によっては、同じ設定でも、次のように、顔や皮膚にも鱗が反映されます。

Alchemy Upscale(Low, smooth)

AlchemyV2:on
Preset:Vibrant
PhotoReal v2:On
Model:Leonardo Kino XL
Dragon Scales:1.20

物語が作れそうです。

どちらも、Elementの強度は、1.20と少し強めなのですが、あまり、違和感を感じません。もともとファンタジー的な設定のせいでしょうか、物語の登場人物として、割合自然な感じすらします。

このDragon Scaleに、Cybertechを組み合わせてみます。

Alchemy Upscale(Low, smooth)

Dragon Scales;1.10  Cybertech:0.40

ちなみに、これをMotionで動画にすると、こんな感じです。
かなり進歩したなぁ、という印象を受けます。

日本人の女性、のケースでは、たとえばこんな感じです。

Alchemy Upscale(Low, smooth)

Dragon Scales:  1.10  Cybertech:0.40

髪の毛の飾りは、オリジナルは、鱗でしたが、AlchemyUpscaleをかけると、このようになりました。

このElementで生成される鱗は、もともとは、この例のような、レインボーカラーになるのが標準のようです。

緑猫の場合は、こんな感じです。

Alchemy Upscale(Low, smooth)

ragon Scales:0.80  Cybertech:0.40

AlchemyUpscaleを掛ける前は、猫の顔もぼんやりと緑がかってますが、処理すると、こんなリアルな感じになります。この良し悪しは、用途によると思います。

最後に、無機的な物体。車の例です。

Original

Dragon Scales:1.00  Cybertech:0.40
車の場合は、AlchemyUpscaleの効果はあまり感じられませんでした。

車の動画は、例えば、こんな感じです。

そして、ドラゴンの例です。

Alchemy Upscale(Low, smooth)

AlchemyUpscaleで処理して、少し、締まりましたが、ちょっとヒョウキンな感じです。この虹色が、ポイントのようです。

なお、LeonardoAIがおすすめのVisionXLでもいくつか生成してみました。
例えば、こんな感じです。

Alchemy Upscale(Low, smooth)

Dragon Scales:0.90  Cybertech:0.40

面白いのは、こちらの方が、耳が伸びてエルフのようになる傾向が強いことです、ファンタジー性が増す傾向にあるようです。
逆に言えば、Kinoは、より現実的な画像を生成する、ということかもしれません。

まとめ

Dragon Scale、は、ファンタジーの世界の登場人物の描写として、なかなか自然で、おもしろいエフェクトを追加した画像を生成してくれるようです。

また、ほぼ同時期に登場したElementのCybertechとは、比較的相性がいいようです。少なくも、Sci-Fiや、ファンタジーの用途的には、それらしい画像をかなり、リアルに作ってくれます。

そして、これをベースとしたMotionによる動画は、かなり精度が向上してきているようです。

OpenAIとの技術提携による今後の進歩が楽しみです。


この記事が気に入ったらサポートをしてみませんか?