【AI:手の修正】画像生成AIの手の破綻を防ぐ❗️サンプリングメソッドを変更して手の修正を実現❗️
どうも皆さん!最近はコーヒーよりも緑茶派の女、葉加瀬あいです!
突然ですが、皆さんは画像生成AIで手の表現をきれいにしたいと思ったことはありませんか?
生成された画像の手の指の本数が不自然だったり、大きなサイズの画像を破綻なく生成したいと考えたりしたことがある方も多いのではないでしょうか。
しかし、実際にAIで画像生成した手を修正するのはとても難しく、画像生成のリソース消費を抑えることも簡単ではありませんよね。「手の表現の不自然さが解消されず、生成された画像が使い物にならない」というのは、画像生成AIユーザーの共通の悩みなんじゃないでしょうか。
そこで今回は、Stable Diffusion WebUIで使用することができる、手の修正方法について解説をしていきたいと思います!
なんと、今回ご紹介する技術はサンプリングメソッドで手の修正をしてしまおうと言うとても面白い技術なんです!
実は最近、それを実現する新しいサンプリングメソッドが開発されまして、このサンプラーは、手の表現の品質を大幅に改善して、大きなサイズの画像も高品質に生成できると注目を集めています!
この記事では、そのサンプラーの仕組みや特徴、Stable Diffusion WebUIへの導入方法などを詳しく解説します。ぜひ最後までお読みいただき、画像生成AIでの手の表現の改善にお役立てください!
⚡️今回の記事を動画で見たい方へ⚡️
こちらの記事の内容を動画で見たいという方は、記事の一番最後にYoutubeの動画リンク(会員限定の非公開リンク)を載せておきますので、そちらからご視聴ください!
※ Youtubeで収益化できるようになれば、私のNoteコンテンツももっと使いやすいものになるようにアプリ化しようと思っているので、動画の共有やご意見番へのアイデアなどお待ちしています!
ご意見番のURL:
⚠️私の記事を読む上での注意事項⚠️
なお、私の記事を読む上での注意事項などをこちらで説明しておりますので、以下のプロフィール記事をご一読いただいた上で閲覧するようお願いいたします。
それでは、早速続きを解説していきたいと思います!
サンプラーとは?
サンプリングメソッドの概要
サンプリングメソッドとは、Stable Diffusionで画像生成する際のアルゴリズムのようなものになります。このサンプリングメソッドにどういったものを使うのかによって、生成される画像の品質や特徴等が変わってくるんですよね!
もう少し詳しく言うと、Stable Diffusion WebUIでは、(画像)のように元の適当な画像にノイズを加えて、そのノイズをだんだんきれいにしていくことで画像生成を行っています。(この元の画像を指定するのがControlNetだったりSeed値だったりといったふうに考えてください。)
(画像)
サンプリングメソッドとは、まさにこの画像からノイズを削減していってどんどんきれいにしていくといった工程を「どのように実行するのか?」といったアルゴリズムになります!
(画像)のようなサンプリングメソッドがStable Diffusionでは使用できたりしますね! (Stable Diffusion WebUI Forgeなどが使用できるようになってからはこちらのサンプリングメソッドがもう少し増えています。)
(画像)
ここで、アルゴリズムという言葉が出てきましたが、こちらに関しては特に難しく考える必要はありません。ノイズを削除するやり方といった意味合いで考えておいてください!
例えば、皆さんは食器洗いとかしますよね?その食器洗いの時にどういった洗剤を使うのかとか、油汚れはまずキッチンペーパーで拭いてからスポンジで洗うのか。とかといった、お皿の洗い方みたいなものだと考えてもらって大丈夫です!
Stable Diffusionでは、それをノイズを減らしていくということに関して行っているので、どのサンプリングメソッドを使うかによって生成されるものが少し異なってくるというわけなんですよね!
例えば、上記で挙げたものをいくつか比較してみると、(画像)のような違いがあります。
(画像)
かなりそれぞれのサンプリングメソッドで生成される画像が違いますよね!ちなみに、このサンプリングメソッドで何を選べばいいかといったことに関しては、使用する学習モデルにおいてもそれぞれ推奨されるサンプリングメソッドなどがあったりします。
(画像)
手の表現の改善効果
それで、今回のそのサンプリングメソッドを使った手の修正方法といったものなんですけども、具体的には、このノイズをきれいにする段階で、手の部分などの画像の部分を一部抽出したり、他の処理領域で圧縮したりなどすることによって、従来のサンプリングメソッドとはまた違ったアルゴリズムで画像生成をすることによって手の修正を行うといった形になります!
つまりは、画像の手の部分を認識したりする必要があるので、あまり小さい手の画像や動物の手などといったものの修正はこの手を修正するサンプリングメソッドでも難しかったりします。
でも、そもそも小さい手をどのぐらいきれいに修正できるかといったことについては今までもずっと画像生成AIの界隈では課題にされていましたし、人間以外の手(動物の手など)についてはそもそもあまり破綻が少ないということで知られていました。
先行リリースされたStable Diffusion 3という最新版の画像生成AIのモデルでも、(画像)のように近くの手は修正できるけども遠くの手は修正できていないんです。
(画像)
画像をよく見てみるとわかりやすいんですけども、手前の手はとてもきれいに生成されているのに奥のほうにある手は少し指の本数が増えたりなどしていますよね。
Stable Diffusion 3は現時点でもとても品質の高い最強の画像生成AIとも言われている学習モデルになるのですが、それでもこの位の小さな手については生成が難しかったりします。
(なのでこの手を拡大して個別で画像生成や編集をして馴染ませるといった形のことを皆さんやられています。)
Stable Diffusion 3についてはまだ一般公開されていないので、アーリーアクセスできる人だけが現在画像生成などを行えている状況なのですが、Stable Diffusion 3が使えるようになれば現在Stable Diffusion WebUIにつまっているようなLoRAやControlNetなどを始めとする様々な技術や拡張機能と一緒に画像生成がとても自由に行えることになるので、まだこちらの最新版モデルについてよくわかっていない方は私もこちらの記事で解説をしていますので、ご一読いただくのがとてもオススメです!
https://note.com/ai_hakase/n/naf4839384e33
なお、こちらについては私の以下のYouTubeチャンネルでも解説をしておりますので、ぜひこちらもご視聴ください!
(ノートの内容をAI技術などを使って動画にした形になります。皆さんの電車やバス等での移動時間等でも視聴できることを考えて作成したので、一般的なYouTubeのような手の込んだ動画編集などは行っていないので、その点はご注意ください!)
https://www.youtube.com/watch?v=lp_k_YxFs3Q&t=2s
それで、今回ご紹介するサンプリングメソッドを使用したやり方についてなんですけども、少し一癖あるのでハンズオンで一緒に詳しく見ながらやっていきましょう!
それで、ここからは会員限定でやっていきたいと思います!
私のノートメンバーシップについてはこちらの記事で詳しく解説をしているので、画像生成AIをはじめとするその他のAI技術や応用方法について詳しく知りたい方は、ご登録した上での閲覧をお勧めします!
https://note.com/ai_hakase/n/ncdcda4208fd7
また、こちらに私のノートやYouTubeの解説案や紹介してほしい技術などを投稿したりするご意見版を作成しましたので、何かご意見等があればこちらからお願いいたします!
https://marshmallow-qa.com/hmriww6y819oynv
それでは、続きを解説していきます!
ここから先は
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?