見出し画像

SD3 Mediumの上位モデル『Stable Image Ultra』でMidjourney並みの美麗な画像を生成できる!

2024年6月12日にStable Diffusion 3 Mediumのweightsが一般公開され、今まではAPI経由で使えていたSD3が、モデルをダウンロードし、自身の環境で使えるようになりました。

SD3 Mediumは、20億パラメータのモデルになりますが、APIで使用できるSD3シリーズの中には、Stable Image Ultraという80億パラメータのモデルがあります。

SD3 Mediumでも、素のモデルであそこまでの品質の高い画像が出力できることに驚きました。

Ultraでは、更に品質の高い画像を簡単なプロンプトで出力できます。まるでMidjourneyを使っているような感覚でした。
以下にUltraを使って生成した画像を掲載します。ChatGPTで作成したプロンプトで生成しました。

Fantasy art style of a medieval warrior standing on a cliff overlooking a vast, enchanted forest, by Frank Frazetta and Boris Vallejo, cinematic composition, trending on ArtStation.
Realistic art style of an elven archer in a moonlit forest, readying an arrow in a tense moment, by Alan Lee and John Howe, cinematic composition, trending on ArtStation.
Fantasy art style of a hero party battling a dark lord in a grand throne room, the hero wielding a shining sword, a mage casting a powerful spell, and a warrior charging forward, the dark lord surrounded by dark energy, by Akira Toriyama and Yoshitaka Amano, cinematic composition, trending on ArtStation.
Photorealistic image of a cute high school girl taking a selfie with a smartphone, wearing a school uniform, smiling brightly with a playful expression, standing in a well-lit classroom with friends in the background, cinematic composition, trending on ArtStation.
Surreal art style of a dreamlike forest where trees have glowing leaves and floating lanterns, a calm river with colorful fish swimming in the air, and a serene moonlit sky, by Salvador Dalí and René Magritte, cinematic composition, trending on ArtStation.
Photorealistic image of a cityscape where buildings are made of giant fruits and vegetables, cars are floating teacups, and people have animal heads while wearing Victorian clothing, bright daylight with clear blue skies, cinematic composition, trending on ArtStation.
Photorealistic image of a cute woman in her twenties playing PC games in a dimly lit room, surrounded by gaming equipment, posters, and snacks, with a focused expression on her face, wearing casual, comfortable clothes, the glow from the monitor illuminating her face, cinematic composition, trending on ArtStation.
Photorealistic image of a crowded Japanese train during rush hour, passengers packed tightly together, some wearing business attire and others in casual clothes, expressions ranging from tired to indifferent, overhead handles and advertisements visible, dim lighting with the glow from electronic devices, cinematic composition, trending on ArtStation.

この記事でご紹介したAI技術の応用方法について、もっと詳しく知りたい方や、実際に自社のビジネスにAIを導入したいとお考えの方、私たちは、企業のAI導入をサポートするAIコンサルティングサービスを提供しています。以下のようなニーズにお応えします。

  • AIを使った業務効率化の実現

  • データ分析に基づくビジネス戦略の立案

  • AI技術の導入から運用までの全面サポート

  • 専門家によるカスタマイズされたAIソリューションの提案

初回相談無料ですので、お気軽にご相談ください。以下のリンクからお問い合わせください。


この記事が気に入ったらサポートをしてみませんか?