- 運営しているクリエイター
#StableDiffusion
【AI活用】動画キャプチャ画像をAIアップスケーラで高画質化【ローカル】
はじめにネットで利用できる拡散モデルの高性能アップスケーラは有料かつ高価である事が多い(例:Magnifiy AI・5900円/月)のですが、やはりその理由は、それに見合った価値があるからではないでしょうか。
たとえば、(一般的に高画質でない)動画のキャプチャ画像をトリミングしたものをアップスケールすれば、任意のショットを高精細な静止画の素材として利用する事もできます。一気に素材の利用範囲が広が
【中級】ローカルのみでの写真超解像化術【無料ソフトウェア】
想定する読者ローカル環境のみを利用して高性能な画像アップスケール技術を利用したい人
ローカルへ Stable Diffusion webUI (forge)、ComfyUI が導入済み
Stable Diffusion 等の基本的な操作ができる人
はじめにこの記事はローカルでアップスケール(写真高画質化目的)を行うノウハウの紹介をします。
ネット上の便利な写真の高画質化サービスはありますが
【RTX 3060】SD3 Medium を試す【ローカル】
はじめにStable Diffusion 3 Medium のローカル利用が可能になったので試してみました。利用した環境は下記になります。
OS:Windows 12 23H2
CPU:Ryzen5 3600
システムメモリ:32G
GPU:RTX 3060 12G
モデル:sd3_medium_incl_clips_t5xxlp16.safetensors
アプリ:ComfyUI
【ローカル】脱獄 Llama3 の画像生成専用プロンプターコマンドを作る【Ollama】
はじめに【※注意※】 脱獄(Uncensored)モデルとはブロック・コンテンツに対してブロック回避のチューニングを施したものです。通常のモデルよりも不正確で不適切な内容が出やすくなります。利用を推奨するものではありません。利用する場合は自己責任でお願いします。※※
この記事では、ローカルで実行可能な大規模言語モデル Llama3 を利用して、次のような画像生成専用の簡単なプロンプター、sd-
「AI生成画像はGPUによって個性がある」は都市伝説か?
はじめに先に結論です。限りなく都市伝説でしょう。しかし、オーディオ専用CDプレーヤが(エラー訂正精度の問題で完全なデジタルとは言えない事を根拠に)高音質であるという話題が尽きないように、プリンターケーブルを短くすれば(ネットワークエラー率が下がり)早く印刷できるという話を完全に否定できないように、真っ赤な嘘という話でもありません。
アーキテクチャが異なれば画像は異なる当たり前の話ですが、世代など
人物の白黒写真高画質カラー化の話
はじめに同じ手法を利用します。
準備下記のパブリックドメインとされるオードリーヘップバーンの写真を利用します。
結果まとめもっと自然な鮮明度&色にしたかったのですが、アイデンティティを保てず断念しました。まだ工夫と研究が必要のようです。
LCMはなぜ高画質なのか?【StableDiffusion】
Stable Diffusion を利用する多くの人が疑問に思っている事だと思いますが、ステップ数の少ない LCM モデルや LCM-LoRA が「高画質」になる理由は、実は簡単です。
SDXL よりも SD1.5 の方が写真に近いという話をしましたが、それと同じです。単純に自由度が少ないからです。潜在空間でズルしてコンストレイントをかけたのが LCM 、LoRA も low rank adap
AIを利用して、PBRテクスチャ作成に挑戦してみた話②
はじめに下記記事のつづきです。
布に挑戦します。
テクスチャ生成Stable Diffusion の tiling 機能を使って、着物用の織物テクスチャを生成します。
凸凹表現Marigold でどこまで表現できるか試します。
模様は問題ないのですが、布の表面までは流石に無理でした。法線マップも生成を試してみましたが、予想どおりイマイチです。
結果Blender で確認します。
まとめ
AIを利用して、PBRテクスチャ作成に挑戦してみた話①
はじめに忙しい皆様のために先に結論です。満足度は30%で、もう少し工夫が必要そうです。
PBR(Physically-Based Rendering)テスクチャとは、光の拡散、法線、凹凸情報などが物理的に正しいテクスチャの事を言います。AI技術を利用すれば、立体構造が簡単に作れるのですが、テクスチャのような微細構造まで再現できるようなものはありませんでした。しかし Marigold のような詳細
【第一回】AI画像フェイククイズ
任意に選んだ(フリー画像素材サイトから選んだ)画像の中に一枚だけ txt2img AI 生成画像が混ざっています。つまり、本物の中の偽物をみつけるクイズです。※ 選んだ素材画像がすでにAI生成の可能性もありますので悪しからず…
答えはページの最後に書いています。
第1問目【初級】偽物はどれでしょうか?①〜④
第2問目【初級】偽物はどれでしょうか?人物①〜④
第3問目【中級】偽物はどれでし
SDXL+SD1.5仕上げ
SD1.5の方がリアルだという記事を書きましたが、
分かり易い例です。
SDXLではSD1.5では難しい、Midjourneyレベルのアーティスティックな生成も可能です。しかし、拡大すると写真にはみえません。そこで、SD1.5系のモデルで img2img します。陰影などのアートさは失われてしまいますが、写真により近くなっています。
アートとして「綺麗かどうか」を問うと賛否両論あると思います
【番外】Stable Diffusion は、なぜ古いバージョンである1.5が最強なのか?【ブログ】
バージョン2.0/2.1に続き、SDXLがリリースされてから既にかなりの時間が経ち、最近では Stable Diffusion 3 が発表されましたが、バージョン1.5の人気が衰える気配がありません。
この記事では、その理由について考察してみたいと思います。
多くの人は次の理由を挙げると思います。
ユーザーが多い
1.5専用の学習モデルが多い
高速で使用メモリも少ない
1.5専用のプロ