見出し画像

Stable Diffusion 3.5が登場!ComfyUIでの動作方法の解説と生成画像の検証

2024年10月22日、Stable Diffusionの最新バージョン、「Stable Diffusion 3.5」が発表されました。今回のバージョンでは、より強力なモデルやカスタマイズ性が加わり、さらに便利に使えるようになっているとのこと。この記事では、Stable Diffusion 3.5の主なポイントや新機能について、分かりやすく解説します。


この記事でご紹介したAI技術の応用方法について、もっと詳しく知りたい方や、実際に自社のビジネスにAIを導入したいとお考えの方、私たちは、企業のAI導入をサポートするAIコンサルティングサービスを提供しています。以下のようなニーズにお応えします。

  • AIを使った業務効率化の実現

  • データ分析に基づくビジネス戦略の立案

  • AI技術の導入から運用・教育までの全面サポート

  • 専門家によるカスタマイズされたAIソリューションの提案

初回相談無料ですので、お気軽にご相談ください。以下のリンクからお問い合わせください。


1. Stable Diffusion 3.5の特徴

この新バージョンでは、特に以下の点で強みがあります。

カスタマイズ性の高さ

Stable Diffusion 3.5は、ユーザーが自分のニーズに合わせて簡単にカスタマイズできるように設計されています。これにより、独自のスタイルを追求したり、特定のプロジェクトに合わせたワークフローを構築することが容易になります。

高いパフォーマンス

Stable Diffusion 3.5 MediumLarge Turboモデルは、標準的な消費者向けハードウェアで動作するように最適化されており、特別な機器がなくてもスムーズに動作します。また、Large Turboは非常に高速な推論時間を提供し、プロジェクトの効率化に貢献します。

多様な出力

このモデルは、異なる肌の色調や特徴を持つ多様な人々の画像を生成することができ、これにより、幅広い表現が可能です。追加のプロンプトを設定しなくても、自然なバリエーションを含んだ画像を生成します。

豊富なスタイル

3Dレンダリング、写真、絵画、線画など、あらゆる視覚スタイルを生成できる柔軟性も魅力です。ユーザーは、自分の好みに合わせたスタイルを選び、クリエイティブな作品を生み出せます。

2. 公開されたモデル

今回公開されたモデルは、以下の3種類になります。

Stable Diffusion 3.5 Large

80億パラメータという大規模なモデルで、高品質な画像生成と優れたプロンプト適応性が特徴です。特に、プロフェッショナルなユースケースに適しており、1メガピクセルの解像度で高精細な画像を生成できます。

Stable Diffusion 3.5 Large Turbo

こちらはLargeモデルのスピードアップ版で、わずか4ステップで画像を生成できるため、より高速な処理が可能です。生成される画像は高品質で、プロンプトの指示にも忠実に従います。

Stable Diffusion 3.5 Medium(10月29日にリリース予定)

25億パラメータを持ち、消費者向けハードウェアでも動作するように設計されたモデルです。これにより、特別な設備がなくても高品質な画像生成が可能となり、解像度は0.25メガピクセルから2メガピクセルまで対応しています。

3. モデルの性能比較

Stable Diffusion 3.5 Largeは、市場においてプロンプトへの適応性でトップクラスを誇り、非常に高い画像品質を実現しています。特に、より大きなパラメータを持つモデルと比較しても、その性能は引けを取りません。また、Stable Diffusion 3.5 Large Turboは、推論時間が極めて速く、生成される画像の質とプロンプト適応性において、非蒸留モデルと比べても優れたパフォーマンスを発揮します。

さらに、Stable Diffusion 3.5 Mediumは他の中型モデルを凌駕しており、プロンプト適応性と画像品質のバランスに優れた効率的なモデルとして、さまざまなユーザーにとって理想的な選択肢となっています。品質とコストの両立を求めるクリエイターには特におすすめです。

4. ライセンス

ライセンスは、Stable Diffusion 3 Mediumと同様のStability AI Community Licenseで提供されています。このライセンスの概要は以下のとおりです。

  • 非商用利用無料: 個人および組織は、科学研究を含む非商用利用において無料でモデルを使用できます。

  • 商用利用無料(年間収益が100万ドル未満の場合): 新興企業、中小企業、クリエイターは、年間収益が100万ドル未満であれば、商用目的でモデルを無料で使用できます。

  • 生成物の所有権: 制限のあるライセンスの影響を受けることなく、生成されたメディアの所有権を保持できます。

年間収益が100万ドルを超える組織の場合は、Enterprise Licenseを申し込む必要があります。(申込はこちら

5. 環境設定

ここからは、ComfyUIで動作させるための環境設定をしていきます。

モデルのダウンロード

以下よりSD3.5のベースモデルをダウンロードし、「ComfyUI/models/checkpoints」に格納してください。

CLIPのダウンロード

以下よりCLIPをダウンロードし、「ComfyUI/models/clip」フォルダに格納してください。

ワークフローのダウンロード

SD3.5 Large (SD3.5L) とLarge Turbo (SD3.5LT) のワークフローは、それぞれ以下よりダウンロードしてください。

これらのワークフローは、ComfyUI公式が提供しているワークフローになります。Turbo用がなかったため、Stability AIが公開していたTurbo用のワークフローを参考にウィジェットの値を調整しています。ComfyUI公式が提供しているSD3.5のワークフローは以下になります。

6. 生成結果の検証

SD3.5LとSD3.5LTの両方で同じシード値とプロンプトを使用して生成した結果を以下に示します。

Prompt 1:
若い女性の剣士が、銀色の長い髪をなびかせ、青い鎧を身にまとい、堂々とそびえ立つ幻想的な城の前に自信満々に立っている。彼女は輝く刀を握り、決意に満ちた真剣な表情を浮かべている。夕日が暖かい黄金の光を投げかけ、古びた石の橋や城の塔に長い影を映し出している。そのシーンは、宮崎駿の映画の一コマを思わせるような、柔らかな拡散した光とわずかなフィルムグレインがあり、魔法的で冒険的な雰囲気を強調している。夕日の鮮やかな色彩と城の鋭いラインが、視覚的に印象的な構図を作り上げている。

Japanese anime-style illustration of a young female swordswoman with long silver hair and blue armor stands confidently in front of a towering fantasy castle. She holds a gleaming katana, her expression resolute and determined. The sunset casts a warm, golden light, casting long shadows and highlighting the ancient stone bridge and castle towers. The scene is reminiscent of a shot from a Hayao Miyazaki film, with soft, diffused lighting and a slight film grain, enhancing the magical and adventurous atmosphere. The vibrant colors of the sunset and the sharp lines of the castle create a visually striking composition.

Prompt 2:
黒い鱗が夜空を反射する巨大な火を吐くドラゴンが、荒涼とした火山の頂に立っている。その口からは灼熱の炎が放たれている。背景には、流れる溶岩と赤黒い空を背にした険しい山々が広がっている。クリストファー・ノーランにインスパイアされたシネマトグラフィーで、広角レンズが広大な風景を捉え、深い影とドラマチックなハイライトが際立つ。柔らかなフィルムグレインが質感を加え、彩度の低いカラーグレーディングが荒涼とした雰囲気を強調している。低い位置からのキーライトが長い影を作り、ドラゴンの背後からのリムライトがそのシルエットを浮かび上がらせ、圧倒的な存在感を強調している。

A giant fire-breathing dragon with black scales reflecting the night sky stands atop a desolate volcanic mountain, its mouth releasing scorching flames. In the background, jagged mountains with flowing lava and a red-black sky. Cinematography inspired by Christopher Nolan, with a wide-angle lens capturing the vast landscape, deep shadows, and dramatic highlights. Soft film grain adds texture, and a desaturated color grading enhances the desolate atmosphere. Key light from a low-angle position casts long shadows, while a rim light from behind the dragon creates a silhouette, emphasizing its imposing presence.

Prompt 3:
薄暗い照明の古い図書館で、木製の棚と石の床が広がる中、長い白髪と深いしわのある顔をした年老いた魔法使いが、魔法の本を読んでいる。その本は淡い青い光を放ち、彼の周りに神秘的な輝きを作り出している。棚の上で揺れるロウソクの炎が、暗くて謎めいた雰囲気を醸し出している。このシーンは、柔らかなフィルムグレインと深い影、冷たい色調で彩られ、ティム・バートンの視覚スタイルを思わせるものとなっている。

In a dimly lit, ancient library with wooden shelves and stone floors, an elderly wizard with long graying hair and a deeply wrinkled face sits reading a magical book. The book emits a pale blue light, casting an ethereal glow around him. Candles flicker on the shelves, creating a dark and mysterious ambiance. The scene is framed with a soft film grain, deep shadows, and a cold color grading, evoking the visual style of Tim Burton.


Prompt 4:
柔らかな光に包まれた部屋、淡い水彩の壁の前に、色白で長いウェーブのかかった赤褐色の髪、そしてエメラルドグリーンの目をした若い女性が立っている。彼女は、繊細なレースがあしらわれた流れるような淡いピンク色のドレスを着ている。彼女の手は、エレガントな筆記体で書かれた「Dream」という言葉の滑らかで流れるような線をそっとなぞっている。その文字は柔らかな幻想的な光を放ち、彼女の周りに暖かく黄金色の輝きを投げかけている。隠れた窓から柔らかく拡散した光が差し込み、夢のようでほとんど神秘的な雰囲気を醸し出している。フィルムグレインが繊細な質感を加え、色調補正により淡いトーンが強調されて、穏やかでほぼ異世界的な印象を与える。まるでウェス・アンダーソンの映画を思わせるような場面だ。

In a softly lit room with pastel watercolor walls, a young woman with fair skin, long wavy auburn hair, and emerald green eyes stands beside a gentle stream of light. She wears a flowing, pastel pink dress with delicate lace trim. Her hand gently traces the smooth, flowing lines of the word "Dream" written in elegant cursive. The letters glow with a soft, ethereal light, casting a warm, golden hue around her. The scene is bathed in a gentle, diffused light from a hidden window, creating a dreamy, almost mystical atmosphere. The film grain adds a subtle texture, and the color grading enhances the pastel tones, giving the image a serene, almost otherworldly feel, reminiscent of a Wes Anderson film.

Prompt 5:
静かな日本庭園にある伝統的な木製の縁側で、色白で繊細な顔立ちの若い日本人女性が、淡いピンク色の着物を着て、絹のような質感で「愛」と書かれた巻物を手に持っている。彼女の目は温かく優しげで、その巻物を、落ち着いた表情をした短い黒髪の若い男性にそっと手渡している。男性は濃紺の着物を着ている。背景には、わずかなグラデーションのある和紙模様が描かれ、奥行きと伝統を感じさせる。シーン全体は柔らかな暖かい光で包まれ、左上からのキーライトが穏やかな影を作り、着物や巻物の質感を際立たせている。色調補正はやや彩度を抑えており、伝統的な優雅さと静けさが強調され、フィルムグレインが少しノスタルジックな雰囲気を加えている。

A serene Japanese courtyard with a traditional wooden veranda, where a young Japanese woman with fair skin and delicate features, dressed in a light pink kimono, is holding a scroll with the kanji "愛" (love) rendered in a silk-screen texture. Her eyes are warm and inviting, and she is gently handing the scroll to a young man with short, dark hair and a calm expression, dressed in a dark blue kimono. The background features a washi paper pattern with subtle gradients, creating a sense of depth and tradition. The scene is bathed in soft, warm lighting, with a key light placed from the upper left, casting gentle shadows and highlighting the texture of the characters' kimonos and the scroll. The color grading is slightly desaturated, emphasizing the traditional elegance and tranquility of the moment, with a hint of film grain adding to the nostalgic feel.

Prompt 6:
夜の未来的なサイバーパンク都市では、ネオンライトがそびえ立つガラスの高層ビルを照らしている。空をホバーカーが飛び交い、街の看板にはホログラム広告がちらついている。下層では雨が降り、濡れた路面が鮮やかなネオンカラーを反射している。ちらつくネオン看板の下に、多様なカップルが立っており、彼らの顔は青とピンクのライトに照らされている。男性は黒いトレンチコートを着た褐色の肌で、女性にキスしようと身を寄せる。女性は色白で、電気のような青い髪を持ち、優しく微笑んでいる。シーンは浅い被写界深度で構成され、賑やかな都市の中でカップルを強調している。照明は柔らかくもドラマチックで、冷たいトーンと暖かいトーンが混じり合い、ムーディーで雰囲気のある感じを醸し出している。リドリー・スコットのビジュアルスタイルにインスパイアされ、フィルムグレインが粗い質感を加え、色調補正でネオンの色彩が強調され、鮮やかで未来的な雰囲気を生み出している。

In a futuristic cyberpunk city at night, neon lights illuminate towering glass skyscrapers. Hovercars zip through the sky, and holographic ads flicker on street signs. Rain falls in the lower levels, creating wet streets that reflect vibrant neon colors. A diverse couple stands under a flickering neon sign, their faces illuminated by the blue and pink lights. The man, with dark skin and a sleek black trench coat, leans in to kiss the woman, who has pale skin and electric blue hair, as she smiles softly. The scene is framed with a shallow depth of field, emphasizing the couple against the bustling city. The lighting is soft yet dramatic, with a mix of cool and warm tones, creating a moody, atmospheric feel. Inspired by the visual style of Ridley Scott, the film grain adds a gritty texture, and the color grading enhances the neon hues, giving the scene a vivid, futuristic vibe.

Prompt 7:
若いスチームパンクの冒険者が、色白でブロンズのゴーグルをつけ、決意に満ちた表情で蒸気駆動の飛行船のデッキに立っている。彼のヴィクトリア朝風のコートは風に揺れ、革の手袋は船の手すりをしっかりと握っている。彼の背後には、歯車とパイプで構成された機械的な世界が、暖かい黄金色の夕日に照らされて輝いている。クリストファー・ノーランにインスパイアされたシネマトグラフィーで、深い影と高いコントラストが、蒸気駆動の機械の細かなディテールを強調している。頭上のランタンからの柔らかな光が暖かい輝きを放ち、ノスタルジックで冒険的な雰囲気を作り出している。フィルムグレインが質感を加え、色調補正で黄金の色調が強調され、シーンが生き生きとしたものになっている。

A young steampunk adventurer with fair skin, bronze goggles, and a determined expression stands on the deck of a steam-powered airship. His Victorian-style coat flutters in the wind, and leather gloves grip the railing. Behind him, a mechanical world of gears and pipes glows under a warm, golden sunset. Cinematography inspired by Christopher Nolan, with deep shadows and high contrast, emphasizing the intricate details of the steam-powered machinery. Soft, ambient light from overhead lanterns casts a warm glow, creating a nostalgic and adventurous atmosphere. Film grain adds texture, and color grading enhances the golden hues, bringing the scene to life.

Prompt 8:
5歳の短い茶色の髪の女の子が、日差しが降り注ぐ草原に立ち、彼女の輝く笑顔がその場を明るくしている。柔らかな黄金色の光が、ふわふわした白い雲が浮かぶ青空を通して差し込み、彼女のそばかすのある頬に優しい影を落としている。軽い風が彼女の髪を揺らし、遊び心を加えている。背景の草原は緑の草と野生の花々が生き生きとした風景を描き、地平線は穏やかで絵のように美しい景色に広がっている。シーン全体は、ウェス・アンダーソンのシネマトグラフィーを思わせるような暖かく懐かしい光に包まれ、わずかなフィルムグレインと控えめな色調が、夢のようで幻想的な雰囲気を際立たせている。

A 5-year-old girl with short brown hair stands in a sunlit meadow, her radiant smile brightening the scene. Soft, golden sunlight filters through the blue sky with fluffy white clouds, casting gentle shadows on her freckled cheeks. A light breeze ruffles her hair, adding a playful touch. The background meadow is a vibrant tapestry of green grass and wildflowers, with the horizon stretching out into a serene, picturesque landscape. The scene is bathed in a warm, nostalgic glow, reminiscent of the cinematography of Wes Anderson, with a subtle film grain and a slightly desaturated color palette that enhances the dreamy, whimsical atmosphere.

Prompt 9:
古代の巨木がそびえ立ち、薄い霧が漂う神秘的な森で、青く輝くキノコが地面を照らしている。金色の輝く髪と透明な羽を持つ妖精と、深いエメラルド色の髪と繊細な緑の羽を持つもう一人の妖精が、そっと抱き合い、目を閉じて静かなつながりの瞬間を共有している。周りには光る球体がゆっくりと漂い、柔らかな幻想的な光を放っている。シーン全体は夢のような雰囲気に包まれ、冷たい青色の色調補正と控えめなフィルムグレインが、ティム・バートンの映画を彷彿とさせる。光源は主に生物発光によるもので、神秘的で異世界的な輝きを生み出している。

In a mystical forest with towering ancient trees and a thin mist hanging in the air, blue-glowing mushrooms illuminate the ground. Two fairies, one with shimmering golden hair and translucent wings, the other with deep emerald hair and delicate green wings, gently embrace, their eyes closed in a moment of serene connection. Glowing orbs drift gently around them, casting a soft, ethereal light. The scene is bathed in a dreamlike atmosphere, with a cool, blue-tinted color grading and subtle film grain, reminiscent of a Tim Burton film. The lighting is primarily from bioluminescent sources, creating a mystical, otherworldly glow.

Prompt 10:
鮮やかなオレンジと黒の縞模様を持つフォトリアリスティックな虎が、緑豊かで密集したジャングルの中をゆっくりと歩いている。木々の天蓋を通して日光が差し込み、森の地面に濃い斑模様の影を落としている。虎の目は鋭く警戒しており、毛の下で筋肉が波打っている。背景には緑の葉やツタが広がり、柔らかな自然のフィルムグレインと暖かい黄金色の色調補正が施されており、アン・リーのシネマティックなスタイルを思わせる。

A photorealistic tiger with vibrant orange and black stripes slowly walks through a dense, lush jungle. Sunlight filters through the canopy, casting deep, dappled shadows on the forest floor. The tiger's eyes are piercing and alert, its muscles rippling under its fur. The background is a lush tapestry of green leaves and vines, with a soft, natural film grain and warm, golden color grading, evoking the cinematic style of Ang Lee.

Prompt 11:
洗練されたSF宇宙船の制御室で、ホログラフィックディスプレイと無数の星が見える大きなガラス窓がある。そこで、色白の短髪の女性と、中東系の整えられたひげを持つ男性の2人のクルーメンバーが緊張感のある会話を交わしている。青と白の光が柔らかく冷たい影を作り、未来的な雰囲気を強調している。女性は心配そうな表情をしており、男性は決然とした表情でホログラフィックディスプレイに視線を固定している。シーンは微妙なフィルムグレインと冷たい彩度を抑えた色調で描かれ、クリストファー・ノーランの緊迫感あふれるSFビジュアルスタイルを思わせるものとなっている。

In a sleek, sci-fi spaceship control room with holographic displays and a large glass window revealing countless stars, two crew members, a fair-skinned woman with short, dark hair and a Middle Eastern man with a trimmed beard, share a tense conversation. Blue and white lights cast soft, cool shadows, enhancing the futuristic atmosphere. The woman’s expression is concerned, while the man looks determined, his eyes fixed on a holographic display. The scene is framed with subtle film grain and a cool, desaturated color grade, evoking the visual style of Christopher Nolan’s high-stakes sci-fi.

Prompt 12:
不気味で寒々しい廃病院の長く暗い廊下が、割れた窓から差し込む冷たい月明かりに照らされている。古い車椅子が不気味に放置され、長い影を落としながら冷たい風に揺れている。壁には色褪せた血痕があり、緊迫した雰囲気をさらに高めている。影がまるで自ら動いているかのように感じられ、差し迫る恐怖を予感させる。シーンはローキーライティングで構成され、ソフトな青と赤のジェルがホラー感を強調し、フィルムグレインが荒々しく不安定なムードを加えている。

In a chillingly eerie abandoned hospital, a dark, long hallway is illuminated by the cold moonlight seeping through broken windows. An old wheelchair sits eerily abandoned, casting long shadows that dance with the cold wind. Faded bloodstains mar the walls, adding to the tense atmosphere. Shadows seem to move of their own accord, creating a sense of impending dread. The scene is framed with a low-key lighting setup, using soft blue and red gels to enhance the horror, with film grain adding to the gritty, unsettling mood.

Prompt 13:
豪華な宮殿の内装で、温かみのあるオリーブ色の肌と深い茶色の目を持つ中年の女性が、優雅なエメラルド色のドレスをまとい、金箔の椅子に上品に座っている。彼女の表情は穏やかで、装飾の施された窓から差し込む自然な柔らかい光が彼女の顔に優しい輝きを投げかけている。頭上には大きな輝くシャンデリアが吊り下がり、複雑な影を作り出し、豪華さをさらに引き立てている。シーン全体は、デヴィッド・フィンチャーの映画を思わせるような暖かい黄金色の光に包まれ、控えめな色調と微妙なフィルムグレインが豊かで落ち着いた雰囲気を演出している。

In a luxurious palace interior, a middle-aged woman with warm olive skin and deep brown eyes, wearing an elegant emerald dress, sits gracefully in a gilded chair. Her expression is serene, framed by soft, natural light filtering through ornate windows, casting a gentle glow on her face. A large, shining chandelier hangs above, casting intricate shadows and adding a touch of opulence. The scene is bathed in a warm, golden hue, reminiscent of a David Fincher film, with subtle film grain and a rich, muted color palette.

Prompt 14:
オリンポス山の頂に立つゼウス。白い髪とひげが風になびき、手にはバリバリと音を立てる雷を持っている。周囲には暗く嵐のような雲が渦巻き、背景では稲妻が閃いている。彼の力強く威厳ある姿は、上方からの劇的な照明に照らされ、深い影が落ちてその筋肉質な体を際立たせている。シーンは広角レンズで構成され、壮大なスケールとその瞬間の緊迫感を捉えている。フィルムグレインが荒々しくテクスチャーのある質感を加え、色調は冷たくムーディーで、神の力と不吉な雰囲気をさらに強調している。

Zeus atop Mount Olympus, his white hair and beard flowing in the wind, holding a crackling thunderbolt. Dark, stormy clouds swirl around him, lightning flashing in the background. His powerful, commanding presence is illuminated by dramatic, directional lighting from above, casting deep shadows and emphasizing his muscular form. The scene is framed with a wide, sweeping lens, capturing the epic scale and intensity of the moment. Film grain adds a gritty, textured quality, while the color grading is cool and moody, enhancing the atmosphere of divine power and foreboding.

Prompt 15:
擬人化されたウサギが、立派で落ち着いた表情で、ビクトリア風のリビングルームで優雅にセッティングされたテーブルで紅茶を飲んでいる。窓には豪華なカーテンが掛けられ、暖炉の暖かい光がシーン全体に柔らかな黄金色の輝きを与えている。ウサギの毛並みは滑らかで整えられており、微かに感じられるフィルムグレインが時代を超えた雰囲気を醸し出している。照明は、カーテン越しに差し込む自然光と暖炉からの温かい琥珀色の光が混ざり合い、ウェス・アンダーソンのビジュアルスタイルを思わせる、居心地の良く洗練された雰囲気を作り出している。

A anthropomorphized rabbit dressed in a dapper gentleman's suit, with a proud and calm expression, sipping tea at an elegantly set table in a Victorian-style living room. Luxurious curtains drape the windows, and a warm fireplace casts a soft, golden glow across the scene. The rabbit’s fur is sleek and well-groomed, with a hint of film grain adding to the timeless feel. The lighting is a mix of natural sunlight filtering through the curtains and the warm, amber tones from the fireplace, creating a cozy and refined atmosphere reminiscent of Wes Anderson’s visual style.

Prompt 16:
浮かぶ島々がピンクと紫の空に浮かび、滝が空中に流れ込み、巨大な輝く月が輝く夢のような光景。島には古代の遺跡が立ち、柔らかく拡散した光に包まれている。色白で黒髪をなびかせた人物と、温かみのあるオリーブ色の肌で鋭い目を持つ人物が、島の縁に立ち、その魔法のような景色を見つめている。彼らは手をつなぎ、その表情は驚きと感嘆に満ちている。照明は柔らかく幻想的で、暖かい黄金色の光が神秘的な雰囲気を強調している。フィルムグレインが微妙な質感を加え、色調補正によってピンクと紫の色彩が際立ち、穏やかで魅惑的なムードを作り出している。

A dreamlike scene of floating islands suspended in a pink and purple sky, waterfalls cascading into the air, and a giant glowing moon. Ancient ruins stand on the islands, bathed in soft, diffused light. Two figures, one with fair skin and flowing dark hair, the other with a warm, olive complexion and sharp eyes, stand on the edge of an island, gazing at the magical vista. They hold hands, their expressions filled with wonder and awe. The lighting is soft and ethereal, casting a warm, golden glow that enhances the mystical atmosphere. Film grain adds a subtle texture, and the color grading emphasizes the pink and purple hues, creating a serene and enchanting mood.

Prompt 17:
詩的な秋の風景の中、年老いた男性が歩いている。彼の顔は年輪を感じさせる優しい表情で、銀髪が印象的だ。彼が歩く道は黄金色の木々に囲まれ、風に舞う落ち葉が枝の間を通る柔らかな黄金色の光を受けて舞い上がる。遠くには湖と山々が温かみのある色合いで輝き、穏やかで静かな雰囲気を醸し出している。シーンは微妙なフィルムグレインと暖かな色調で彩られ、テレンス・マリックのシネマティックなスタイルを思わせる。低いアングルから撮影されたカットは、壮大な木々と男性の物思いにふけった表情を強調している。

In a lyrical autumn landscape, an elderly man with a weathered, kind face and silver hair walks along a path lined with golden trees. Fallen leaves swirl in the wind, catching the soft, golden light that filters through the branches. The distant lake and mountains shimmer in warm tones, creating a peaceful, serene atmosphere. The scene is framed with subtle film grain and warm color grading, evoking the cinematographic style of Terrence Malick, with a low-angle shot emphasizing the majestic trees and the man's contemplative expression.

Prompt 18:
星空の下、小さな村が光り輝き、渦巻く星々と明るい月が柔らかな青い光を投げかけている。遠くの山々が空を背景にシルエットとして浮かび上がり、大胆な筆致と鮮やかな色彩が動的でエネルギッシュなシーンを作り出している。この様子はまるでゴッホのスタイルを思わせる。村はランタンの暖かい黄金色の光に包まれ、空の冷たい青との対比が印象的だ。フィルムグレインが質感を加え、色調補正が幻想的な雰囲気をさらに強調している。

A small village glows under a starry night sky, with swirling stars and a bright moon casting a soft blue glow. Distant mountains are silhouetted against the sky, and bold brushstrokes and vivid colors create a dynamic and energetic scene, reminiscent of Van Gogh’s style. The village is bathed in a warm, golden light from lanterns, contrasting with the cool blue of the sky. Film grain adds texture, and the color grading enhances the mystical atmosphere.

Prompt 19:
異世界的で幻想的な風景の中、空は燃えるような赤とオレンジに染まり、巨大な岩が無重力の空間に浮かんでいる。光の球体がゆったりと漂い、幻想的な輝きを放っている。長い銀髪と発光する青い瞳を持つ青白い女性が、浮かぶ岩の上に立ち、炎のような背景を背に彼女の肌が淡く輝いている。彼女は光り輝く球体を、強い黄金色の目を持つ褐色の肌の男性に差し出しており、彼の表情には驚きと好奇心が入り混じっている。シーンは柔らかなフィルムグレインで包まれ、色調補正により空の暖かさと光球の冷たい輝きが強調され、夢のような雰囲気が作り出されている。照明は主に上方からのソフトボックスを使用し、柔らかな影を作り出し、岩やキャラクターの質感を際立たせている。

In a surreal, otherworldly landscape with a sky painted in fiery red and orange, massive rocks float in zero-gravity space. Orbs of light drift lazily, casting ethereal glows. A pale, ethereal woman with long, silver hair and luminescent blue eyes stands on a floating rock, her skin glowing softly against the fiery backdrop. She holds out a glowing orb to a dark-skinned man with intense, golden eyes, his expression a mix of awe and curiosity. The scene is framed with a soft film grain, the color grading enhances the warmth of the sky and the cool glow of the orbs, creating a dreamlike atmosphere. Lighting is primarily from an overhead softbox, casting gentle shadows and emphasizing the textures of the rocks and characters.

Prompt 20:
細身の金属製のヒューマノイドAIが、超高層ビルの頂上に立ち、未来的な都市の風景を見下ろしている。ホログラム広告がシーンを照らし、多彩な色の光を投げかけている。ロボットの洗練されたボディはネオンの輝きを反射し、その高度なデザインが強調されている。背景の都市は、空中橋や飛行する車両によって繋がれたそびえ立つ高層ビル群の迷宮だ。照明はドラマチックで、青と紫の色合いが支配的であり、ムーディーで雰囲気のある感覚を作り出している。フィルムグレインが粗い質感を加え、色調補正によりサイバーパンクの美学が強調され、シーンはディストピア的でありながらも魅惑的に仕上がっている。

A slender, metallic humanoid AI with glowing blue eyes stands atop a skyscraper, overlooking a futuristic cityscape. Holographic advertisements illuminate the scene, casting vibrant, multi-colored light. The robot's sleek body reflects the neon glow, emphasizing its advanced design. The background city is a maze of towering skyscrapers, interconnected by sky bridges and flying vehicles. The lighting is dramatic, with blue and purple hues dominating, creating a moody, atmospheric feel. Film grain adds a gritty texture, while the color grading enhances the cyberpunk aesthetic, making the scene both dystopian and mesmerizing.

Prompt 21:
色白で長い黒髪を持ち、輝く笑顔の日本人の少女が、日差しを浴びたビーチに立っている。彼女は青と白の水玉模様の水着を着ており、その生地が体にぴったりとフィットしている。ビーチは柔らかい砂が広がり、穏やかな波が岸辺に寄せている。空は鮮やかな青色で、ところどころにふわふわとした白い雲が浮かんでいる。照明は自然光で、右上から太陽の暖かい黄金色の光が差し込み、柔らかな影を作りながら彼女の特徴を際立たせている。浅い被写界深度で撮影されたシーンは、背景が少しぼかされており、微妙なフィルムグレインが質感を加えている。色調補正は暖かみがあり、わずかに彩度を抑えて、ノスタルジックで日差しを浴びた雰囲気を演出している。

A Japanese girl with fair skin, long black hair, and a radiant smile stands on a sunlit beach. She wears a blue and white polka-dot swimsuit, the fabric clinging to her figure. The beach is golden, with soft sand and gentle waves lapping at the shore. The sky is a vibrant blue, with a few fluffy white clouds. The lighting is natural, with the sun casting a warm, golden glow from the upper right, creating soft shadows and highlighting her features. The scene is captured with a shallow depth of field, blurring the background slightly, and a subtle film grain adds texture. The color grading is warm, with a slight desaturation to give a nostalgic, sun-kissed feel.

色々と画像を生成してみての所感を述べます。

  • SD3.5LとSD3.5LTを比較すると、SD3.5Lの方が画像の詳細度が高い

  • 複数人や手の生成が甘い

  • イラストの画像はいまいちか

  • 日本語の描画はできない(英語のみ)

  • プロンプトの理解力は高い

7. まとめ

Stable Diffusion 3.5は、性能面やカスタマイズ性が大幅に向上した最新バージョンで、様々なクリエイティブなプロジェクトにおいて非常に有用です。特に、プロンプト適応性や画像生成の品質が向上し、消費者向けハードウェアでも動作可能な点は、大きな利点です。

しかしながら、手や複数人物の生成においてはまだ課題が残っており、特定のスタイルやイラストの生成には若干の改善が必要です。加えて、日本語プロンプトには対応していないため、英語での指示が必要となります。

全体的には、Stable Diffusion 3.5は、より広範な用途で活用できる強力なツールとして評価できる一方で、さらなる改良が期待される点もあります。


動画教材プラットフォーム「Coloso」にて、ComfyUIの使い方をまとめた講座「ComfyUIマスター: カスタムノードとアプリ開発」を公開しています。ComfyUIの基礎から応用、ComfyUIを利用したアプリ開発まで、ComfyUIをマスターするための内容を解説する講座になります。
今、予約注文すると、最大25%オフで購入できます。ComfyUIをマスターしたい方は、ぜひ以下のリンクよりご購入ください。


いいなと思ったら応援しよう!