#StableDiffusion
【AI活用】動画キャプチャ画像をAIアップスケーラで高画質化【ローカル】
はじめにネットで利用できる拡散モデルの高性能アップスケーラは有料かつ高価である事が多い(例:Magnifiy AI・5900円/月)のですが、やはりその理由は、それに見合った価値があるからではないでしょうか。
たとえば、(一般的に高画質でない)動画のキャプチャ画像をトリミングしたものをアップスケールすれば、任意のショットを高精細な静止画の素材として利用する事もできます。一気に素材の利用範囲が広が
【中級】ローカルのみでの写真超解像化術【無料ソフトウェア】
想定する読者ローカル環境のみを利用して高性能な画像アップスケール技術を利用したい人
ローカルへ Stable Diffusion webUI (forge)、ComfyUI が導入済み
Stable Diffusion 等の基本的な操作ができる人
はじめにこの記事はローカルでアップスケール(写真高画質化目的)を行うノウハウの紹介をします。
ネット上の便利な写真の高画質化サービスはありますが
【RTX 3060】SD3 Medium を試す【ローカル】
はじめにStable Diffusion 3 Medium のローカル利用が可能になったので試してみました。利用した環境は下記になります。
OS:Windows 12 23H2
CPU:Ryzen5 3600
システムメモリ:32G
GPU:RTX 3060 12G
モデル:sd3_medium_incl_clips_t5xxlp16.safetensors
アプリ:ComfyUI
【ローカル】OllamaとComfyUIで高性能写真アップスケーラを作る【StableDiffusion】
想定する読者すべてローカル&無料ソフトウェアを利用したい人
オリジナルに忠実なアップスケーラを ComfyUI で作りたい人
ComfyUI をローカルへインストール済み
Ollama をローカルへインストール済み
※ ComfyUI の json ファイルダウンロードのみを有料欄に記載しています。ノード情報は画像としてすべて無料公開しています。
※ ComfyUI や Ollama イ
【ローカル】Stable Diffusion テクニック10選【無料ソフトウェアのみ】
はじめに新しいものではありませんが、Stable Diffusion の基本テクニックをまとめてみました。
この記事で利用するソフトウェアは、
Stable Diffusion webUI(または forge)
IOPaint
Ollama Open WebUI(ローカル LLM)
です。
① 同じキャラクターの生成その1他の生成システムでも同じですが、一度に生成してコンシステンシーを
【AI画像編集】IOPaint 完全攻略【ローカル生成の無料ソフトウェア】
はじめにAI画像系のソフトウェアとして Stable Diffusion webUI や ComfyUI は有名ですが、IOPaint は実力は非常に高いのにあまり知名度は高くありません。この記事では IOPaint(旧 Lama Cleaner)の機能を解説します。
公式レポジトリはこちら、
Windows への詳細な導入方法は下記に記載しています。※ PyPI に登録されているので、pip
【入門】多様性のあるAI画像生成【Stable Diffusion】
プロンプトを利用して画像を生成する場合、複雑で多様性のある画像を生成するには、多くの情報を文字として与える必要があります。もちろん、AIを利用して複雑で長い文字列を生成してもいいのですが、もっと簡単に、ノイズを入力として与える事もできます。
つまり、img2img でノイズ画像を利用します。そもそもtxt2imgも初期にノイズ画像から始まりますので。
あとは、denoising strengt
AI生成画像の一般的な修正方法
はじめに日々さまざまな新しいAI技術が発表され、画像修正技術も進歩していますが、それでも汎用的に利用できる事は少なく、修正箇所が何かと干渉していたりすると上手く行かなくなる事がほとんどです。
この記事では、「汎用的」に活用できる修正アイデアを紹介します。
前景と背景を分けるAI画像でありがちなのが、背景コンテキストがおかしい事です。地平線がずれたりするものです。まずは、前景(主題)と背景を分け
人物の白黒写真高画質カラー化の話
はじめに同じ手法を利用します。
準備下記のパブリックドメインとされるオードリーヘップバーンの写真を利用します。
結果まとめもっと自然な鮮明度&色にしたかったのですが、アイデンティティを保てず断念しました。まだ工夫と研究が必要のようです。
【入門】リアル系顔 LoRA 作成入門
【付録に本学習データセットとLoRAファイルを有料でダウンロードできます】
想定する読者Stable Diffusion のリアル系顔 LoRA を作ってみたい人
はじめにこの記事では、過去に生成した好きな「顔」画像を利用して、入門者向け顔 LoRA 作成方法を解説していきます。きっとAIがあなたの好みの特徴を学習してくれるでしょう。必要なものは、
自分で作成した学習用イメージ
この記事で
【中級】AI画像生成ワークフロー紹介
想定する読者Stable Diffusion webUI (forge) が利用できる人
IOpaint が利用できる人
画像エディタを利用して基本的な画像処理ができる人
はじめに最近の定着しつつあるワークフローを紹介します。
構図の作成手書き、3Dモデル、その他もろもろのAI生成システムでもいいのですが、凡その構図を作成します。今回は SDXL モデルを利用します。1024x768 で
【入門】GTX 1660ti の限界を調べる【StableDiffusion】
はじめに先に結論です。設定したやり方では限界に到達しませんでした。。
webUIが発表された当時だと 1660 (6G) では、512x512 解像度でも失敗する事があり、実用的な上限は1024x1024でした。
しかし2024年現在、メモリ管理周りが大きく改善した Stable Diffusion webUI Forge と最新の Nvidia GPU ドライバを利用すると、システムメモリを
【入門】各種AIソフトウェアのインストールを一気に解説していく【Windows】
想定している読者【難しい内容ではなく入門者向けですが、どちらかと言うと、ガッツリ理解したい人向けです】
※ 単に Stable Diffusion を動かしたいだけなら、現状は StabilityMatrix が最適です。
※ github に公開されているAIソフトウェアを、誰かの解説なしに利用したい人向けです。
【ローカルでさまざまな画像系AIソフトウェア利用を本格的にはじめたいと考え
【入門】NMKD Stable Diffusion GUI で LoRA を作る
想定する読者NMKD Stable Diffusion GUI をインストールできる人
ローカルで画像生成を行った事がある人
LoRA を使った事のある人
はじめにStable Diffusion の爆発的な人気で、様々なローカル生成用の実装が公開されましたが、ブラウザで利用する webUI でなく、一般的な Windows アプリケーションとして実用的に利用できるのは NMKD Stab