マガジンのカバー画像

AI画像生成入門

19
Catapp-Art3D の入門者向けの記事をまとめています。
運営しているクリエイター

#StableDiffusion

【AI活用】動画キャプチャ画像をAIアップスケーラで高画質化【ローカル】

【AI活用】動画キャプチャ画像をAIアップスケーラで高画質化【ローカル】

はじめにネットで利用できる拡散モデルの高性能アップスケーラは有料かつ高価である事が多い(例:Magnifiy AI・5900円/月)のですが、やはりその理由は、それに見合った価値があるからではないでしょうか。

たとえば、(一般的に高画質でない)動画のキャプチャ画像をトリミングしたものをアップスケールすれば、任意のショットを高精細な静止画の素材として利用する事もできます。一気に素材の利用範囲が広が

もっとみる
【中級】ローカルのみでの写真超解像化術【無料ソフトウェア】

【中級】ローカルのみでの写真超解像化術【無料ソフトウェア】

想定する読者ローカル環境のみを利用して高性能な画像アップスケール技術を利用したい人

ローカルへ Stable Diffusion webUI (forge)、ComfyUI が導入済み

Stable Diffusion 等の基本的な操作ができる人

はじめにこの記事はローカルでアップスケール(写真高画質化目的)を行うノウハウの紹介をします。

ネット上の便利な写真の高画質化サービスはありますが

もっとみる
【RTX 3060】SD3 Medium を試す【ローカル】

【RTX 3060】SD3 Medium を試す【ローカル】

はじめにStable Diffusion 3 Medium のローカル利用が可能になったので試してみました。利用した環境は下記になります。

OS:Windows 12 23H2

CPU:Ryzen5 3600

システムメモリ:32G

GPU:RTX 3060 12G

モデル:sd3_medium_incl_clips_t5xxlp16.safetensors

アプリ:ComfyUI

もっとみる
【ローカル】OllamaとComfyUIで高性能写真アップスケーラを作る【StableDiffusion】

【ローカル】OllamaとComfyUIで高性能写真アップスケーラを作る【StableDiffusion】

想定する読者すべてローカル&無料ソフトウェアを利用したい人

オリジナルに忠実なアップスケーラを ComfyUI で作りたい人

ComfyUI をローカルへインストール済み

Ollama をローカルへインストール済み

※ ComfyUI の json ファイルダウンロードのみを有料欄に記載しています。ノード情報は画像としてすべて無料公開しています。

※ ComfyUI や Ollama イ

もっとみる
【ローカル】Stable Diffusion テクニック10選【無料ソフトウェアのみ】

【ローカル】Stable Diffusion テクニック10選【無料ソフトウェアのみ】

はじめに新しいものではありませんが、Stable Diffusion の基本テクニックをまとめてみました。

この記事で利用するソフトウェアは、

Stable Diffusion webUI(または forge)

IOPaint

Ollama Open WebUI(ローカル LLM)

です。

① 同じキャラクターの生成その1他の生成システムでも同じですが、一度に生成してコンシステンシーを

もっとみる
【AI画像編集】IOPaint 完全攻略【ローカル生成の無料ソフトウェア】

【AI画像編集】IOPaint 完全攻略【ローカル生成の無料ソフトウェア】

はじめにAI画像系のソフトウェアとして Stable Diffusion webUI や ComfyUI は有名ですが、IOPaint は実力は非常に高いのにあまり知名度は高くありません。この記事では IOPaint(旧 Lama Cleaner)の機能を解説します。

公式レポジトリはこちら、

Windows への詳細な導入方法は下記に記載しています。※ PyPI に登録されているので、pip

もっとみる
【入門】多様性のあるAI画像生成【Stable Diffusion】

【入門】多様性のあるAI画像生成【Stable Diffusion】

プロンプトを利用して画像を生成する場合、複雑で多様性のある画像を生成するには、多くの情報を文字として与える必要があります。もちろん、AIを利用して複雑で長い文字列を生成してもいいのですが、もっと簡単に、ノイズを入力として与える事もできます。

つまり、img2img でノイズ画像を利用します。そもそもtxt2imgも初期にノイズ画像から始まりますので。

あとは、denoising strengt

もっとみる
AI生成画像の一般的な修正方法

AI生成画像の一般的な修正方法

はじめに日々さまざまな新しいAI技術が発表され、画像修正技術も進歩していますが、それでも汎用的に利用できる事は少なく、修正箇所が何かと干渉していたりすると上手く行かなくなる事がほとんどです。

この記事では、「汎用的」に活用できる修正アイデアを紹介します。

前景と背景を分けるAI画像でありがちなのが、背景コンテキストがおかしい事です。地平線がずれたりするものです。まずは、前景(主題)と背景を分け

もっとみる
人物の白黒写真高画質カラー化の話

人物の白黒写真高画質カラー化の話

はじめに同じ手法を利用します。

準備下記のパブリックドメインとされるオードリーヘップバーンの写真を利用します。

結果まとめもっと自然な鮮明度&色にしたかったのですが、アイデンティティを保てず断念しました。まだ工夫と研究が必要のようです。

【入門】リアル系顔 LoRA 作成入門

【入門】リアル系顔 LoRA 作成入門

【付録に本学習データセットとLoRAファイルを有料でダウンロードできます】

想定する読者Stable Diffusion のリアル系顔 LoRA を作ってみたい人

はじめにこの記事では、過去に生成した好きな「顔」画像を利用して、入門者向け顔 LoRA 作成方法を解説していきます。きっとAIがあなたの好みの特徴を学習してくれるでしょう。必要なものは、

自分で作成した学習用イメージ

この記事で

もっとみる
【中級】AI画像生成ワークフロー紹介

【中級】AI画像生成ワークフロー紹介


想定する読者Stable Diffusion webUI (forge) が利用できる人

IOpaint が利用できる人

画像エディタを利用して基本的な画像処理ができる人

はじめに最近の定着しつつあるワークフローを紹介します。

構図の作成手書き、3Dモデル、その他もろもろのAI生成システムでもいいのですが、凡その構図を作成します。今回は SDXL モデルを利用します。1024x768 で

もっとみる
【入門】GTX 1660ti の限界を調べる【StableDiffusion】

【入門】GTX 1660ti の限界を調べる【StableDiffusion】

はじめに先に結論です。設定したやり方では限界に到達しませんでした。。

webUIが発表された当時だと 1660 (6G) では、512x512 解像度でも失敗する事があり、実用的な上限は1024x1024でした。

しかし2024年現在、メモリ管理周りが大きく改善した Stable Diffusion webUI Forge と最新の Nvidia GPU ドライバを利用すると、システムメモリを

もっとみる
【入門】各種AIソフトウェアのインストールを一気に解説していく【Windows】

【入門】各種AIソフトウェアのインストールを一気に解説していく【Windows】


想定している読者【難しい内容ではなく入門者向けですが、どちらかと言うと、ガッツリ理解したい人向けです】

※ 単に Stable Diffusion を動かしたいだけなら、現状は StabilityMatrix が最適です。

※ github に公開されているAIソフトウェアを、誰かの解説なしに利用したい人向けです。

【ローカルでさまざまな画像系AIソフトウェア利用を本格的にはじめたいと考え

もっとみる
【入門】NMKD Stable Diffusion GUI で LoRA を作る

【入門】NMKD Stable Diffusion GUI で LoRA を作る


想定する読者NMKD Stable Diffusion GUI をインストールできる人

ローカルで画像生成を行った事がある人

LoRA を使った事のある人

はじめにStable Diffusion の爆発的な人気で、様々なローカル生成用の実装が公開されましたが、ブラウザで利用する webUI でなく、一般的な Windows アプリケーションとして実用的に利用できるのは NMKD Stab

もっとみる