マガジンのカバー画像

ブログ

36
Catapp-Art3Dのブログです。
運営しているクリエイター

#StableDiffusion

【AI活用】動画キャプチャ画像をAIアップスケーラで高画質化【ローカル】

【AI活用】動画キャプチャ画像をAIアップスケーラで高画質化【ローカル】

はじめにネットで利用できる拡散モデルの高性能アップスケーラは有料かつ高価である事が多い(例:Magnifiy AI・5900円/月)のですが、やはりその理由は、それに見合った価値があるからではないでしょうか。

たとえば、(一般的に高画質でない)動画のキャプチャ画像をトリミングしたものをアップスケールすれば、任意のショットを高精細な静止画の素材として利用する事もできます。一気に素材の利用範囲が広が

もっとみる
【中級】ローカルのみでの写真超解像化術【無料ソフトウェア】

【中級】ローカルのみでの写真超解像化術【無料ソフトウェア】

想定する読者ローカル環境のみを利用して高性能な画像アップスケール技術を利用したい人

ローカルへ Stable Diffusion webUI (forge)、ComfyUI が導入済み

Stable Diffusion 等の基本的な操作ができる人

はじめにこの記事はローカルでアップスケール(写真高画質化目的)を行うノウハウの紹介をします。

ネット上の便利な写真の高画質化サービスはありますが

もっとみる
【RTX 3060】SD3 Medium を試す【ローカル】

【RTX 3060】SD3 Medium を試す【ローカル】

はじめにStable Diffusion 3 Medium のローカル利用が可能になったので試してみました。利用した環境は下記になります。

OS:Windows 12 23H2

CPU:Ryzen5 3600

システムメモリ:32G

GPU:RTX 3060 12G

モデル:sd3_medium_incl_clips_t5xxlp16.safetensors

アプリ:ComfyUI

もっとみる
【ローカル】脱獄 Llama3 の画像生成専用プロンプターコマンドを作る【Ollama】

【ローカル】脱獄 Llama3 の画像生成専用プロンプターコマンドを作る【Ollama】


はじめに【※注意※】 脱獄(Uncensored)モデルとはブロック・コンテンツに対してブロック回避のチューニングを施したものです。通常のモデルよりも不正確で不適切な内容が出やすくなります。利用を推奨するものではありません。利用する場合は自己責任でお願いします。※※

この記事では、ローカルで実行可能な大規模言語モデル Llama3 を利用して、次のような画像生成専用の簡単なプロンプター、sd-

もっとみる
「AI生成画像はGPUによって個性がある」は都市伝説か?

「AI生成画像はGPUによって個性がある」は都市伝説か?

はじめに先に結論です。限りなく都市伝説でしょう。しかし、オーディオ専用CDプレーヤが(エラー訂正精度の問題で完全なデジタルとは言えない事を根拠に)高音質であるという話題が尽きないように、プリンターケーブルを短くすれば(ネットワークエラー率が下がり)早く印刷できるという話を完全に否定できないように、真っ赤な嘘という話でもありません。

アーキテクチャが異なれば画像は異なる当たり前の話ですが、世代など

もっとみる
人物の白黒写真高画質カラー化の話

人物の白黒写真高画質カラー化の話

はじめに同じ手法を利用します。

準備下記のパブリックドメインとされるオードリーヘップバーンの写真を利用します。

結果まとめもっと自然な鮮明度&色にしたかったのですが、アイデンティティを保てず断念しました。まだ工夫と研究が必要のようです。

LCMはなぜ高画質なのか?【StableDiffusion】

LCMはなぜ高画質なのか?【StableDiffusion】

Stable Diffusion を利用する多くの人が疑問に思っている事だと思いますが、ステップ数の少ない LCM モデルや LCM-LoRA が「高画質」になる理由は、実は簡単です。

SDXL よりも SD1.5 の方が写真に近いという話をしましたが、それと同じです。単純に自由度が少ないからです。潜在空間でズルしてコンストレイントをかけたのが LCM 、LoRA も low rank adap

もっとみる
AIを利用して、PBRテクスチャ作成に挑戦してみた話②

AIを利用して、PBRテクスチャ作成に挑戦してみた話②

はじめに下記記事のつづきです。

布に挑戦します。

テクスチャ生成Stable Diffusion の tiling 機能を使って、着物用の織物テクスチャを生成します。

凸凹表現Marigold でどこまで表現できるか試します。

模様は問題ないのですが、布の表面までは流石に無理でした。法線マップも生成を試してみましたが、予想どおりイマイチです。

結果Blender で確認します。

まとめ

もっとみる
AIを利用して、PBRテクスチャ作成に挑戦してみた話①

AIを利用して、PBRテクスチャ作成に挑戦してみた話①

はじめに忙しい皆様のために先に結論です。満足度は30%で、もう少し工夫が必要そうです。

PBR(Physically-Based Rendering)テスクチャとは、光の拡散、法線、凹凸情報などが物理的に正しいテクスチャの事を言います。AI技術を利用すれば、立体構造が簡単に作れるのですが、テクスチャのような微細構造まで再現できるようなものはありませんでした。しかし Marigold のような詳細

もっとみる
ペルセウスの物語

ペルセウスの物語

クラーケンは北欧神話なので、例のストーリです。①枚目だけは真面目に作りました。

AIを使えば簡単にストーリー絵が作れると言いますが、真面目に衣装や人物をちゃんとコンシステントするには相当な手間が必要になると思います。

【第一回】AI画像フェイククイズ

【第一回】AI画像フェイククイズ


任意に選んだ(フリー画像素材サイトから選んだ)画像の中に一枚だけ txt2img AI 生成画像が混ざっています。つまり、本物の中の偽物をみつけるクイズです。※ 選んだ素材画像がすでにAI生成の可能性もありますので悪しからず…

答えはページの最後に書いています。

第1問目【初級】偽物はどれでしょうか?①〜④

第2問目【初級】偽物はどれでしょうか?人物①〜④

第3問目【中級】偽物はどれでし

もっとみる
SDXL+SD1.5仕上げ

SDXL+SD1.5仕上げ

SD1.5の方がリアルだという記事を書きましたが、

分かり易い例です。

SDXLではSD1.5では難しい、Midjourneyレベルのアーティスティックな生成も可能です。しかし、拡大すると写真にはみえません。そこで、SD1.5系のモデルで img2img します。陰影などのアートさは失われてしまいますが、写真により近くなっています。

アートとして「綺麗かどうか」を問うと賛否両論あると思います

もっとみる
【番外】Stable Diffusion は、なぜ古いバージョンである1.5が最強なのか?【ブログ】

【番外】Stable Diffusion は、なぜ古いバージョンである1.5が最強なのか?【ブログ】

バージョン2.0/2.1に続き、SDXLがリリースされてから既にかなりの時間が経ち、最近では Stable Diffusion 3 が発表されましたが、バージョン1.5の人気が衰える気配がありません。

この記事では、その理由について考察してみたいと思います。

多くの人は次の理由を挙げると思います。

ユーザーが多い

1.5専用の学習モデルが多い

高速で使用メモリも少ない

1.5専用のプロ

もっとみる