マガジンのカバー画像

AI画像生成入門

19
Catapp-Art3D の入門者向けの記事をまとめています。
運営しているクリエイター

#AI画像生成

【RTX 3060】SD3 Medium を試す【ローカル】

【RTX 3060】SD3 Medium を試す【ローカル】

はじめにStable Diffusion 3 Medium のローカル利用が可能になったので試してみました。利用した環境は下記になります。

OS:Windows 12 23H2

CPU:Ryzen5 3600

システムメモリ:32G

GPU:RTX 3060 12G

モデル:sd3_medium_incl_clips_t5xxlp16.safetensors

アプリ:ComfyUI

もっとみる
【ローカル】Stable Diffusion テクニック10選【無料ソフトウェアのみ】

【ローカル】Stable Diffusion テクニック10選【無料ソフトウェアのみ】

はじめに新しいものではありませんが、Stable Diffusion の基本テクニックをまとめてみました。

この記事で利用するソフトウェアは、

Stable Diffusion webUI(または forge)

IOPaint

Ollama Open WebUI(ローカル LLM)

です。

① 同じキャラクターの生成その1他の生成システムでも同じですが、一度に生成してコンシステンシーを

もっとみる
【AI画像編集】IOPaint 完全攻略【ローカル生成の無料ソフトウェア】

【AI画像編集】IOPaint 完全攻略【ローカル生成の無料ソフトウェア】

はじめにAI画像系のソフトウェアとして Stable Diffusion webUI や ComfyUI は有名ですが、IOPaint は実力は非常に高いのにあまり知名度は高くありません。この記事では IOPaint(旧 Lama Cleaner)の機能を解説します。

公式レポジトリはこちら、

Windows への詳細な導入方法は下記に記載しています。※ PyPI に登録されているので、pip

もっとみる
【画像生成】プロンプトは Google Gemini に聞こう【Stable Diffusion】

【画像生成】プロンプトは Google Gemini に聞こう【Stable Diffusion】

いつの間にか、Gemini に画像や動画なども同時に表示されるようになってますね。

髪型の名称が欲しい時は、

ポーズの場合は、

非常に便利になりました。

ある学者が言ってましたが、これからのプロンプトエンジニアリングは AI が行うべきものという話でした。AI からより良い情報や回答を得るために、人がエンジニアリングとして分析した理屈でなく(そのシステムの) AI がアシストする。確かに理

もっとみる
【入門】多様性のあるAI画像生成【Stable Diffusion】

【入門】多様性のあるAI画像生成【Stable Diffusion】

プロンプトを利用して画像を生成する場合、複雑で多様性のある画像を生成するには、多くの情報を文字として与える必要があります。もちろん、AIを利用して複雑で長い文字列を生成してもいいのですが、もっと簡単に、ノイズを入力として与える事もできます。

つまり、img2img でノイズ画像を利用します。そもそもtxt2imgも初期にノイズ画像から始まりますので。

あとは、denoising strengt

もっとみる
【入門】リアル系顔 LoRA 作成入門

【入門】リアル系顔 LoRA 作成入門

【付録に本学習データセットとLoRAファイルを有料でダウンロードできます】

想定する読者Stable Diffusion のリアル系顔 LoRA を作ってみたい人

はじめにこの記事では、過去に生成した好きな「顔」画像を利用して、入門者向け顔 LoRA 作成方法を解説していきます。きっとAIがあなたの好みの特徴を学習してくれるでしょう。必要なものは、

自分で作成した学習用イメージ

この記事で

もっとみる
【入門】GTX 1660ti の限界を調べる【StableDiffusion】

【入門】GTX 1660ti の限界を調べる【StableDiffusion】

はじめに先に結論です。設定したやり方では限界に到達しませんでした。。

webUIが発表された当時だと 1660 (6G) では、512x512 解像度でも失敗する事があり、実用的な上限は1024x1024でした。

しかし2024年現在、メモリ管理周りが大きく改善した Stable Diffusion webUI Forge と最新の Nvidia GPU ドライバを利用すると、システムメモリを

もっとみる
【入門】各種AIソフトウェアのインストールを一気に解説していく【Windows】

【入門】各種AIソフトウェアのインストールを一気に解説していく【Windows】


想定している読者【難しい内容ではなく入門者向けですが、どちらかと言うと、ガッツリ理解したい人向けです】

※ 単に Stable Diffusion を動かしたいだけなら、現状は StabilityMatrix が最適です。

※ github に公開されているAIソフトウェアを、誰かの解説なしに利用したい人向けです。

【ローカルでさまざまな画像系AIソフトウェア利用を本格的にはじめたいと考え

もっとみる
【入門】NMKD Stable Diffusion GUI で LoRA を作る

【入門】NMKD Stable Diffusion GUI で LoRA を作る


想定する読者NMKD Stable Diffusion GUI をインストールできる人

ローカルで画像生成を行った事がある人

LoRA を使った事のある人

はじめにStable Diffusion の爆発的な人気で、様々なローカル生成用の実装が公開されましたが、ブラウザで利用する webUI でなく、一般的な Windows アプリケーションとして実用的に利用できるのは NMKD Stab

もっとみる
【入門】ローカルで利用するAI画像生成ソフトウェア管理のための基礎知識①【Windows】

【入門】ローカルで利用するAI画像生成ソフトウェア管理のための基礎知識①【Windows】


想定する読者Stable Diffusion 等のAIソフトウェアをローカルにインストールして使い始めたが、Python の管理や仕組みを理解したいと考えている人

非 Python 開発者、非技術者等の AI ソフトウェア利用中心の人

はじめにAI画像生成システムをローカルで構築する上で知っておくべき技術的な内容の紹介をします。ただし、Python 開発者や AI 技術向けではなく、「AI

もっとみる
【入門者】GTX 1650 縛りの Stable Diffusion

【入門者】GTX 1650 縛りの Stable Diffusion


想定する読者Stable Diffusion webUI (forge) を利用してみたいという人

GTX 1650 を持っている人

はじめにAI画像生成はGPU(グラフィック・カード)のメモリを大量に利用します。コスパが最も良いおすすめのGPUは筆者も利用している RTX 3060 (12G版)ですが、円安の影響もあり、型落ちであるにも関らず4万円はします。

そこで、利用者の最も多いと思

もっとみる