マガジンのカバー画像

画像生成AI技術書

12
AIイラスト生成に関する技術的な記事を取りまとめてます!
運営しているクリエイター

記事一覧

LoRAを作ってみよう!~基礎編~

はじめに今回はXアンケートの結果で、LoRA学習についてご要望が一番多かったので、LoRA学習について学んでいこうと思います! LoRAに限らず、モデルを学習させるという作業について、難しいのでは?と思われる方が多いかと思います。 確かに、専門用語や一定の知識がないと理解は得られにくいかもしれません。 誰でも分かるように、限りなく噛み砕いて説明していきますので、今回は基礎から説明していこうと思います。 LoRAとはLoRAは生成AI界隈では、もはや自分の名前よりも目に

Würstchenアーキテクチャを利用したStable Cascadeの仕組みを理解する

はじめに久しぶりの知見を深めようシリーズです。(?) 2024/2/13に、Stability AI社がStable Cascadeを発表しました。 その新モデルに採用されているWürstchenアーキテクチャの論文を読んでみて、理解を深めようというのが今回の記事です。 Würstchenアーキテクチャの概要とStable CascadeについてWürstchenとは、ドイツ語でソーセージを意味します。 キンキンに冷えたビールに合いそうな名前で、まさにビールとソーセージが

実際に使用しているSD WebUIのお勧め拡張機能をご紹介!

はじめに今回は、いつものニッチな記事ではなく、ゆるーくやっていこうと思います! 私が実際に使用しているSD WebUIの拡張機能を紹介していきます! 中にはもう擦られまくって、説明不要な拡張機能もありますので、じっくりは説明しません! どんなことができるかだけ、簡単にご紹介しようと思います! ※詳しい使い方については、この記事では紹介していませんのであしからず…。 おすすめの拡張機能 Config-Presets ScreenShot 説明 各種の生成設定値をプ

DALL-Eアーキテクチャは何故描写の崩壊が抑えられているのか?

はじめに 今、巷で高精細で描写の崩壊がしにくいと言われる、OpenAI社のDALL-E 3が話題ですね! DALL-E 3の前身であるDALL-E、DALL-E 2で使用されているDALL-Eアーキテクチャと、現在主流になっているStable Diffusionは何が違うのかを説明していきたいと思います。 今回の内容は、比較的専門用語が飛び交うので、事前知識がないと「???」となるかもしれません。ご了承ください…。 事前知識はこちらをご覧ください。 DALL-Eとは

SD WebUIが正常に動作しない!A1111 WebUIのトラブルシューティングについて徹底網羅!

はじめに 皆さんはこんな経験ありませんか? 「よーし、今日は新しいモデルでイラスト生成するぞー!」 と、このようにエラー出力されて、生成がうまく完了しないとか、期待した動作が行われないなど、結構よくあるものです。 今回は、AUTOMATIC1111 WebUI(以下WebUI)の使用中に、「こんな時どのように対処すればいいの!?」ということを、ケース別に紹介していこうと思います。 大体この記事を見たら解決できるよう、頑張って書いていきます…! Changelo

生成AIを利用する方へ!PCパーツ換装時のトラブルシューティング!(クローンM.2 SSD&メモリ増設編)

はじめに今回お伝えすることは、実際に私が遭遇した事象です。 自身の備忘録も兼ねて、noteに残しておきたいと思います。 (今後、さらに増設とかするかもしれないので…) PCパーツ換装しようと思った経緯やはり、生成AIを使用していたり、モデルを製作していたりすると、どうしても抱える問題があります。 それは、AIの処理速度ではありません。 圧倒的なメモリ不足と、モデルデータ等の大容量データによるストレージ圧迫です。 SDXL1.0がStability AI社よりリリース発

AUTOMATIC1111 WebUIをチューニングしよう!WebUIの高速化を解説!(2023.6.13追記)

はじめに今回は、AUTOMATIC1111版WebUI(以下WebUI)の高速化にフォーカスを当ててお伝えします。 WebUIは日々更新が続けられています。 最新版ではバグなどがある場合があるので、一概に更新が正義とは限りません。 但し、新しいPythonパッケージに適用するように更新されていることが多く、その恩恵を受けるためにも正しくチューニングしましょう! 今回は、とても技術的な要素が多く出てきます。 コーヒーでも飲みながらゆっくり読んでみてください。 [2023/

自分好みのUpscalerを探そう!非Build-In Upscalerを徹底解説!

はじめに今回は、高解像度処理を行うUpscalerを取り上げます。 Upscalerと言っても、今回はBuild-In(WebUI初期装備)のUpscalerではなく、非Build-In(=外部Upscaler)に注視してみようと思います。 UpscalerとはUpscalerを語る前に、どのように動作するかアルゴリズムを簡単に説明します。 と、毎度の事ながら、英語で書かれていて何のことかわからないと思います。 一言に要約が難しいので、一つずつ解説します。 Upscal

階層マージのやり方ととーふ流のモデル階層マージを徹底解説(階層マージ基礎編)

はじめに今回は、 単純マージ、階層マージとは何か 筆者が実際にやっている階層マージの方法 の2本立てです。 前半部分は単純マージと階層マージの説明になります。 後半部分は階層マージの基本的な操作方法と、とーふ流モデル階層マージについてご紹介したいと思います。 階層マージって何?難しくない?という方、ちょっと待ってください! 一見難しそうですが、実際は全体を見ると単純です。 是非、階層マージにチャレンジしてみてください。 マージについてマージとは、とても簡単に説明す

WebUIをスマホ上から外出先で操作する方法(構築編)

はじめに前回(WebUIをスマホ上から外出先で操作する方法(基礎知識編))の続きになります。 ご覧頂いていない方は、こちらの記事内容を鵜呑みにする前に、外出先でのアクセスの仕方には様々な方法がありますので、基礎知識編からご覧ください。 今回取り扱う方法は、導入には少し難があるものの、実装すると便利の幅が広がるものです。 是非、皆さんもチャレンジしてみてください。 実装内容今回は以下の通りに実装します。 起動バッチに[ --listen ]を付与し、イントラネット環境にV

WebUIをスマホ上から外出先で操作する方法(基礎知識編)

はじめにStable Diffusion WebUIへスマホからアクセスする方法は様々あります。 リモートデスクトップを利用し、スマホからアクセスする 起動バッチ引数に[ --share ]を付与し、スマホからID/PWを入力しアクセスする 起動バッチ引数に[ --listen ]を付与し、スマホからアクセスする クラウドGPUサービスにSD環境を構築し、スマホからアクセスする 多岐に渡る方法がありますが、これを用いて行う際のメリットとデメリット、おすすめの構築方法

画像生成AIにおけるClip Skip値の優位性

はじめに皆さん、Clip Skipの値を気に留めたことはありますか? 画像生成AIには、Clip Skipという項目を目にしたことがある方が多いと思いますが、正直何のことかよくわかっていない方も多いと思います。 そこで、今回はClip Skipに関する内容を、紐解いていってみようと思います。 Clip Skipとは ※2023.05.03 引用元の内容に誤りがあった為、引用元を変更しています。 と、ズラッと英語が並んでいてぱっと見、何のことかわからないと思いますので、要