マガジンのカバー画像

AI画像生成入門

19
Catapp-Art3D の入門者向けの記事をまとめています。
運営しているクリエイター

2024年4月の記事一覧

【AI画像編集】IOPaint 完全攻略【ローカル生成の無料ソフトウェア】

【AI画像編集】IOPaint 完全攻略【ローカル生成の無料ソフトウェア】

はじめにAI画像系のソフトウェアとして Stable Diffusion webUI や ComfyUI は有名ですが、IOPaint は実力は非常に高いのにあまり知名度は高くありません。この記事では IOPaint(旧 Lama Cleaner)の機能を解説します。

公式レポジトリはこちら、

Windows への詳細な導入方法は下記に記載しています。※ PyPI に登録されているので、pip

もっとみる
【画像生成】プロンプトは Google Gemini に聞こう【Stable Diffusion】

【画像生成】プロンプトは Google Gemini に聞こう【Stable Diffusion】

いつの間にか、Gemini に画像や動画なども同時に表示されるようになってますね。

髪型の名称が欲しい時は、

ポーズの場合は、

非常に便利になりました。

ある学者が言ってましたが、これからのプロンプトエンジニアリングは AI が行うべきものという話でした。AI からより良い情報や回答を得るために、人がエンジニアリングとして分析した理屈でなく(そのシステムの) AI がアシストする。確かに理

もっとみる
【入門】多様性のあるAI画像生成【Stable Diffusion】

【入門】多様性のあるAI画像生成【Stable Diffusion】

プロンプトを利用して画像を生成する場合、複雑で多様性のある画像を生成するには、多くの情報を文字として与える必要があります。もちろん、AIを利用して複雑で長い文字列を生成してもいいのですが、もっと簡単に、ノイズを入力として与える事もできます。

つまり、img2img でノイズ画像を利用します。そもそもtxt2imgも初期にノイズ画像から始まりますので。

あとは、denoising strengt

もっとみる
AI生成画像の一般的な修正方法

AI生成画像の一般的な修正方法

はじめに日々さまざまな新しいAI技術が発表され、画像修正技術も進歩していますが、それでも汎用的に利用できる事は少なく、修正箇所が何かと干渉していたりすると上手く行かなくなる事がほとんどです。

この記事では、「汎用的」に活用できる修正アイデアを紹介します。

前景と背景を分けるAI画像でありがちなのが、背景コンテキストがおかしい事です。地平線がずれたりするものです。まずは、前景(主題)と背景を分け

もっとみる
人物の白黒写真高画質カラー化の話

人物の白黒写真高画質カラー化の話

はじめに同じ手法を利用します。

準備下記のパブリックドメインとされるオードリーヘップバーンの写真を利用します。

結果まとめもっと自然な鮮明度&色にしたかったのですが、アイデンティティを保てず断念しました。まだ工夫と研究が必要のようです。

戦艦大和をカラー高画質化させてみた話

戦艦大和をカラー高画質化させてみた話

はじめに生成 AI 技術を利用して、戦艦大和の白黒写真のカラー高画質化に挑戦します。元画像は、Wikipedia のパブリックドメイン写真を利用します。

カラー化まずは、カラー化のみを行います。利用したソフトウェアは Deoldifyを使います。公式のリポジトリはこちら。

導入方法は、(まだ)DeOldify に関して記述していませんが、Anaconda 導入です。下記を参考ください。

De

もっとみる
【入門】リアル系顔 LoRA 作成入門

【入門】リアル系顔 LoRA 作成入門

【付録に本学習データセットとLoRAファイルを有料でダウンロードできます】

想定する読者Stable Diffusion のリアル系顔 LoRA を作ってみたい人

はじめにこの記事では、過去に生成した好きな「顔」画像を利用して、入門者向け顔 LoRA 作成方法を解説していきます。きっとAIがあなたの好みの特徴を学習してくれるでしょう。必要なものは、

自分で作成した学習用イメージ

この記事で

もっとみる
BrushNet を使ってみた話

BrushNet を使ってみた話

はじめにAI画像生成界隈では、日々さまざまな技術が発表されています。この記事ではその中のひとつの BrushNet というものを試してみます。

公式レポジトリはこちら

「 A Plug-and-Play Image Inpainting Model with Decomposed Dual-Branch Diffusion」というものですが、精度良くインペイントするものの”ようです”(すみませ

もっとみる
【中級】AI画像生成ワークフロー紹介

【中級】AI画像生成ワークフロー紹介


想定する読者Stable Diffusion webUI (forge) が利用できる人

IOpaint が利用できる人

画像エディタを利用して基本的な画像処理ができる人

はじめに最近の定着しつつあるワークフローを紹介します。

構図の作成手書き、3Dモデル、その他もろもろのAI生成システムでもいいのですが、凡その構図を作成します。今回は SDXL モデルを利用します。1024x768 で

もっとみる
【入門】GTX 1660ti の限界を調べる【StableDiffusion】

【入門】GTX 1660ti の限界を調べる【StableDiffusion】

はじめに先に結論です。設定したやり方では限界に到達しませんでした。。

webUIが発表された当時だと 1660 (6G) では、512x512 解像度でも失敗する事があり、実用的な上限は1024x1024でした。

しかし2024年現在、メモリ管理周りが大きく改善した Stable Diffusion webUI Forge と最新の Nvidia GPU ドライバを利用すると、システムメモリを

もっとみる