見出し画像

Leonardo.AIの新機能(Contents Reference, Multi-Style Reference)と新エレメント(White Ethereal)など

Image Guidance(Control Net)とElements(LoRA)が次々と登場

新エレメント "White Ethereal" (5/30)

先日、オーストラリア時間の5月25日にImage Guidance 2とCharacter Referenceが発表され、昨日5月31日にそのメモを公開しました。

それと前後して、5月30日に新しいXL系用エレメントの " White Ethereal "がリリースされています。どうやらその効果を見ると、White Ether Real と言いたいようです。Discordに次のような説明が出ています。

” ホワイトエーテリアルを紹介します。これは、Leonardoのエレメントスイートの最新追加アイテムで、ハイキーライティングがドリーミーな白色トーンと出会ったものです。
白色の光の美しさを各フレームで捉えながら、ソフトでアンビエントな美学を創造したいデジタルアーティストとデザイナーに理想的です。”

白の美しさといえば、白魔女のフィオナさんですね。生成画像の例をご紹介します。

Fiona (White Ethereal 0.5)

Model: Leonardo Kino XL,  Style: Bokeh,  Element:White Ethereal 0.5)

確かに、綺麗な雰囲気の白です。

注:今気づきましたが、Image GenerationでのStyle(Preset)の表記とPersonal Feed上での表記が異なっています。Bokehで生成した画像が、後者ではCinematicと表示されます。Presetでのオリジナルの値がバグで表示されているのか、根本的に違うのか、別途確認が必要です。

なお、この画像は、先ほど、パブリックに設定しました。

以下の古い下書きに示すように、4月ー5月上旬にも新エレメントが計4つ登場していますので、6月1日付では、XL系エレメントが総計28個となっています。

XL系の新エレメント2つ+2つ(4月〜5月上旬)

5月上旬に、2つのXL用のElementがリリースされています。5月4日に、Soft Pastel Anime、また、5月7日に、Modern Analog Photographyです。

その前に、Psychedelic Art(4月26日)とFiery Flames(5月1日)の2つのXL系Elementがリリースされています。

これらLoRAを用いたElementsは、そのいくつかを組み合わせることで、絵画の画風的な雰囲気を醸しだせるのがあり、気に入った組み合わせが何通りかでてきています。
別途、生成画像と共に、別記事にてメモしておこうと思います。

Elementsの件はさておき、まずは、先日に途中までメモしていたImage Guidanceの2つの新機能(Contents Reference, Multi-Style Reference)とそれを用いた画像生成の例を取り上げます。

Image Guidanceの新機能2つ

Leonardo.AIに、5月5日、2つの新機能がリリースされています。
Contents ReferenceMulti-Style Referenceです。どちらも有料です。
これらは、いずれも、Image Guidanceの機能となります。つまり、Stable Diffusion (Stability AI)のControle Net技術を用いたものです。

進め方

今回の2つの機能は、それぞれ組み合わせも可能なので、以下をそれぞれまとめて示すことにします。

1.まず、Discordにあった説明文の和訳をそれぞれ示します。
2.   次に、その説明文と実際の画面の例に基づき操作手順をトレースしてみます。
3. 生成画像の例を示します。

全体がちょっと長くなりそうなので、今回は、1、についてメモします。

新機能を用いた画像生成の例

ちなみに、トップの画像は、Contents Referenceと、Style Referenceを組み合わせ生成した画像です。
基となったのは、このヴェロキラプトルのオリジナル生成画像です。

恐竜といえば、最近のイメージはカラフル。トップ画像は、プロンプトとContents Referenceでオリジナルに色付けをして、背景をStyle Referenceで変更してみました。
さらにAlchemy Upscalerで処理をしています。

こんなことが、比較的簡単にできます。プロンプトは、次に示すように、かなりシンプルです。
Velociraptors with feathers of spots in colors such as purple, green, yellow, and orange

この画像生成などをしていて、しばらくしてから、先日Character Referenceが追加されました。

こうした適用事例を具体的に振り返ってみると、このContents Referenceの処理技術の延長上で、顔にフォーカスした抽出技術や処理方法の成果として、最新のCharacter Referenceが登場したのではないか、とも感じます。

Contents Ref.とMulti-Style Ref.の説明

さて、改めてContents ReferenceMulti-Style Referenceの話に戻ります。
この2つの新機能のいずれについても、Leonardo.AIにしては珍しく、リリースと同時に説明がFAQ&Helpにアップされています。
All Collections>Feature releases>Image Guidanceで見ることができます。

ただし、極めて簡素で、はっきり言ってこの説明では、私には、よくわかりませんでした。例をみると、色違いの同じ形の靴や、アニメの主人公のようなのが例示されてます。色違いの画像が作れるらしい、という感じです。

Discordの方に、もう少し詳しく説明が乗っていたので、まずは、それぞれご紹介します。

原文を乗せると冗長になるので、和訳にやや補完した説明文を以下示します。一部、原文も引用します。和訳は、基本、Notionを用いました。場合によっては、DeepLも使ってます。

2つの機能の説明

FEATURE 1: Content Reference

概要

この機能は、任意の入力画像の形状と形を取り、それを画像生成のガイドに使用します。
これは、単に深度やエッジをマッピングしたコントロールネットというだけでなく、入力された内容で生成を意味論的(注)にガイドするものである。
(原文;This is more than just a depth or edge mapped controlnet, it semantically guides the generation with your input content.)

あなたのプロンプトはあなたの生成の色とスタイルを決定します - それは既存の画像をスタイル変更するのに最適な方法です。
また、スタイル参照と組み合わせることも可能です。

注:ここでは、Semantics(意味論)を背景にしてこの言葉を使っていると解釈しました。意味論については、たとえば、ChatGPTやGeminiなどで、 ”写真や図形の意味論について教えて下さい。また、その解析方法などについて、項目出しをして、それぞれについて解説してください” などと尋ねると、とことん答えてくれます。

このあたりの解析手法などに、Leonardo.AIのオリジナリティーがあるのかもしれません。

いくつかの使用例:

Restyling(再スタイリング): 既存の画像をコンテンツ参照として使用し、異なるスタイル参照を使用して画像を変形させます。

バリエーション:既存の画像をコンテンツ参照として使用し、プロンプトを微調整してバリエーションを作成します

テキスト:大きなテキストの画像をコンテンツ参照として使用し、それを高度にスタイリッシュな出力に変えます

始める方法:

  1. Image Generationのページに移動し、XLモデルが選択されていることを確認します(できればAlchemy v2をONにします)

  2. 画像ガイダンスタブをクリックし、画像をアップロード/選択し、ドロップダウンからコンテンツ参照を選択します

  3.  プロンプトを設定し、生成します

  4. 任意で、別の画像を追加してスタイル参照として使用します

強度設定

Content Referenceには、3つの強度設定があります:

  • 低 - 最も緩やかなコンテンツガイダンスで、出力画像に大きな自由度を許容します。これにより、プロンプトの影響力が大幅に増します。

  • 中 - これにより、出力は入力画像にはるかに近くなりますが、プロンプトによる自由度も十分に保たれます。

  •  高 - 最も厳密にあなたの入力の形状と形に従い、あなたのプロンプトは主にそれをスタイル変更します。


FEATURE 2: Multi-Style Reference

概要

これが来ることはお伝えしていました。本日より、最大4つのスタイル参照を追加し、それぞれを独立して重み付けることができるようになりました。スタイル参照の強度は参照間で共有されますが、各参照の重みは独立して調整することができます。

これは、異なるスタイルを精度高くブレンドやミックスしたいクリエイターのための機能です。創造的な可能性は非常に大きい - あなたがこれをどこまで持っていくかを見るのが待ち遠しいです!これが来ることはお伝えしていました。本日より、最大4つのスタイル参照を追加し、それぞれに重み付けができるようになりました。スタイル参照の強度は参照間で共有されますが、各参照の重みは個別に調整できることにご注意ください。

始める方法:

  • 参照画像(最大4つ)をImage Guidanceツール内の別々の画像ガイダンスセクションにアップロードします

  • 各画像で、ドロップダウンからStyle Referenceを選択します

  • あなたのStyle Referenceの強度をLowからMaxまで選択します(この設定はすべての参照画像に適用されます)

  • スライダーを使用して個々の参照画像の影響力をシフトします。

これらの機能は創造的なコントロールのアップグレードをもたらします。あなたがそれらをどのように使用するかを見るのが待ち遠しいです。
それらを共有するのを忘れないでください - 投稿する場合はソーシャルにタグをつけてください!


Discordにあった説明文の和訳は以上です。
次回は、トップ画像のような画像生成の事例等について、ご紹介したいと思います。

この記事が気に入ったらサポートをしてみませんか?