見出し画像

生成AI忘備録


画像生成AI

各環境の比較

stableDiffusion WebUI forge版(イージーインストーラー)

Animagine XL 3.0の無料生成スペース

高解像度で画像を生成できる著作権保護された画像を使用していないクリーンモデル

stableDiffusion WebUI 1111版

本体

コマンドラインの種類

Froge版


reForge

 Forgeの後継として実験的立ち位置となったWebUI

SwarmUI


stableDiffusionの仕組み:技術レベル別詳細ガイド

AIの仕組み(初心者編)

stableDiffusionの仕組み(上級者向け)

stableDiffusionの仕組み(超級者向け)

stable Diffusionの各種技術はどのように動いているか?

フルサイズのコントロールネット学習方法

Diffusersフォーマットへの変換

データセットアップロード

コントロールネットLoRAのコントロールネット学習方法

WebUI拡張機能


SDXLモデル

ベースモデル(LoRA学習用)

7th_Layer_XL

イージーインストーラーのモデルが置いてある場所(ミラー)
置いてあるモデル
・Juggernaut-XL_v9_RunDiffusionPhoto_v2
・animagine-xl-3.1
・fuduki_mix_v20
・hanamomopony_v12
・hanamomopony_v14
・momoiropony_v14

pony系列のモデルの使い方

PCM_SDXL_LoRAs

新しい手法の高速生成技術

animagine xl 3.0用のlcm-lora

何も学習していない素のSDXLモデル

SDXLで崩壊した画像が出るバグの対策

省メモリ化

FLUX.1

 stable diffusionを開発したstabilityAI社の開発者で構成されたスタッフが開発したDALLE寄りの画像生成AIモデル

追加学習・モデルマージ

学習全般

 LoRAなどをGUIで簡単に学習できるツール

WindowsとLinuxでの学習速度の比較

CUDA on WSL2の速度比較と環境構築

huggingface-cliログインを使用した際に適切にトークンがコピーされないときはコンソールを右クリックしてください

accelerate configを設定することでaccelerateを使用したトレーニングができるようになります

Finetuning

LoRA

LoRA設定項目解説

LoRA学習

マスクを指定してLoRAを学習してくれるやつ

SDXLにおけるLoRAの学習設定まとめ


KohyaGUI SDXLを低VRAMで学習する際の推奨設定

KohyaGUIトラブルシューティング

WebUI上で学習ができるツール

導入時のエラー対処法

データセット・作成ツール

学習補助

CUDAインストールコマンドを簡単に作れるやつ

もしもPyTorchでCUDAが使えなかったら

敵対的学習

モデルマージ

その他の便利情報

AIモデル共有の方法とWebUIカスタマイズ

SDWebUI 1111版でモデルを共有したい場合

SDWebUI forge版でモデルを共有したい場合

WebUIとComfyUIでモデルを共有する方法

オンラインでメタデータ表示

NovelAI

NovelAI公式

画像のメタデータを見れる公式ページ

NAI V3版の公式の元素法典

NAI V3版の元素法典

バイブストランスファーを使ったイラスト制作

シトラスさんによるNovelAIで使えるプロンプトの辞典

DALLE3

Webp→png等への変換サイト

 DALLE3ではwebpという拡張子で出力されるため適宜pngなどに変換する必要がある。

Github

GitHubでのReadmeの書き方


Krita

ComfyUI

カスタムノード一覧と翻訳された内容


ComfyUIのAnimateをLCMで高速化する

ComfyUI用のX-Adapter

Efficiency Nodes

 ComufUIの簡易版。ノードがまとまっているため初心者にも簡単にできる

AI画像簡易チェックツール

DALLE3とAdobe Firefly

画像加工ツール

イラスト高画質化

線画抽出

背景削除

超高速で背景を削除してくれる

グリーンバック作成ローカルアプリ

被写体抽出



AI背景素材サイト

モデルライセンス

大規模言語モデル(chatgpt・その他)

無料LLMチャットシステム

 c4ai-command-r-plusやMeta-Llama-3-70B-Instructなどの大規模言語モデルを無料かつGPTライクなUIで操作できるページ


各LLMの性能比較

ChatGPT活用事例

Microsoft社員によるchatgpt活用事例


レベルファイブによる活用事例

Claude3 Opusによる小説批評事例

芸大生による生成AI活用事例

AIと小説の歴史

東大などが公開するchatgptの活用事例やpython入門など

Claude3用の公式プロンプトライブラリ

LLMのプロンプト技術まとめ

ChatGPTが無反応だったり日本語に設定しても英語で出力されるときの対処法


ChatGPTのAPIをコマンドプロンプトから使用する方法

研究における文献検索

大規模言語モデルLLMにおける学習のコツ


ローカルLLM

現在最も使いやすいローカルLLMの入門インターフェース

text-generation-webuiはここからダウンロードできる

Google Colabでの実行する場合は下記を参照

自分のPCでの実行方法

現時点日本語最高性能

GPUのVRAMが24GBあれば動くr-V1の4bit量子化版
 text generation WebUI上で動作可能

日本語チャット・ノベル専用高性能モデル

海外論文翻訳サイト

画像をもとに会話できるマルチモーダルAI(LLaVA1.6)

micro-agent

 LLMにコード生成させる時に、先にテストを生成させ、次にコード生成、コードがテストをパスするまで修正を繰り返すところまで自動化する機能


ローカルLLM用データセット

音声・音楽AI

Udioの公式サイトと公式解説

Sunoの公式サイトと公式解説

Microsoft Copilot版のSnoV3のやり方

無料でSunoを使えるサイト


UsioとSunoの比較

Udioの作例


Stable Audio 2.0

PDFの情報を元にAIがラジオを作成

日本語音声認識モデル

音声だけを切り取り

ボイスチェンジャー

変換0.047秒の高速変換 GPU不要のボイチェンソフト

動画生成AI

AnimateAnyone


Open Soraの無料生成スペース

AI以外

モリサワによる括弧の使い分け

SNSでバズる方法

Xでバズったポストはどのように拡散されたかの調査をした膨大な資料


Xにおける画像比のおすすめ

インプレゾンビ駆逐用

様々なサービスの解約方法をまとめたサイト

コードが動かない理由

GPUのTips

型番の意味

AIと著作権・法律全般

文化庁が毎年作成している著作権法の入門書

柿沼弁護士による


アメリカの著作権侵害

著作権法の表現上の本質的特徴とは何か

VPNで偽装しても開示請求でバレる

侮辱罪のアウト事例集

この記事が気に入ったらサポートをしてみませんか?