マガジンのカバー画像

最新AI研究&検証

61
最新AIの最前線に立つ技術、理論、応用を深掘りするマガジンです。検証結果や研究の記事をまとめています。
運営しているクリエイター

#StableDiffusion

AUTOMATIC1111 がv1.10.xにアップデートでSD3Mをサポートしたという噂を聞きつけ試してみた

AUTOMATIC1111のアップデートとStable Diffusion 3 MediumStable Diffusion web UIといえばAUTOMATIC1111氏のものを基本的には指すと思います。ずいぶん浸透してきましたね。 一方で、そのweb UIで特にたくさん使われるはずであった新モデルStable Diffusion 3 Mediumの知名度は低いままの印象です。 とりあえず今回AUTOMATIC1111のアップデートにより、使える状況になったと聞いて試して

画像を3Dに0.5秒で変換するAIツール「Stable Fast 3D」を試してみる

Stable Fast 3DとはStable Fast 3D…一瞬で画像を3D化するということでちょっと話題になってたので調べてみましたが、1 枚の画像からわずか 0.5 秒で高速かつ高品質のテクスチャ付きオブジェクト メッシュを再構築する新しい手法で、内容としてはStability AIでTripoSR をベースにしているものとのこと。 作者はMark Bossさん。偉大な発明をありがとう! 速さと質が売りのようなので、わたしも急いでいじってみたいと思います! 🌐プロジェ

任意の画像の色塗りをしたりクオリティをアップさせたりするControlNetのエクステンション「MistoLine」を試してみる

MistoLineはあらゆるタイプの線画入力に適応できるSDXL-ControlNetモデルで、手描きのスケッチやControlNetの様々な線画プリプロセッサ、モデル生成アウトラインなどの線画に基づいて、高品質の画像 (短辺が 1024 ピクセル以上) を生成できるとのこと。 (MistoLineは線画プリプロセッサごとに異なる ControlNet モデルを選択する必要もないとのことでした。) 今回はこのMistoLineを試してみたいと思います。 🌐プロジェクトページ

画像に照明効果を付与できるIC-LightをComfyUIで試してみる

ControlNetの開発者であるlllyasviel氏が画像に照明効果を付与できる「IC-Light」を作っていて、その性能のよさにXでも話題になったのでいじってみたいと思います! こちらもControlNet同様オープンソース。素晴らしい🥳 プロジェクトページ🌐プロジェクトページ類はこちら 早速いじってみるデモのUIはこんな感じでした。 ドレスを着たねこちゃんで試してみたのですが、とても良い感じに変換されました! 話題になっているだけあって使い方や特性を公開してい

2D-to-3Dの「TripoSR」が話題になったので試してARで召喚してみたよ🐱

Tripo × Stability AI が公開した3D生成AIモデル「TripoSR」。 これが精度よく単一画像からの3Dオブジェクト生成をしてくれると話題になってたので早速試してみようと思います。 詳しくはweelさんの記事がとても分かりやすかったので貼っておきます! インストール後の画面はこんな感じでした。 それではまずStable Diffusion Web UIで黒猫ちゃんを呼んで入れてみる。 すぐ3D化できちゃいます。まじの1秒です。 茶色い猫でも試して

ふわっとstable-diffusion-webuiのAPIを試してみたよ

ふとstable-diffusion-webuiのAPIってどうなってんのかな~と思ったのでちょこっと試してみました。 AUTOMATIC1111版では下記のようにAPIについてまとまっているページもあってありがたし!! さてさて、まず最初は--apiをコマンドラインオプションに追加して Web UI を実行しましょ! なお、コマンドラインについての詳細は下記から。 https://github.com/AUTOMATIC1111/stable-diffusion-web

ControlNetから手軽に出来るディープフェイクで話題になってる『IP-Adapter FaceID』も試してReActorとの違いを感じた夜

先日ディープフェイク機能が強化された「ReActor」をA1111版Stable Diffusion web UIで試しました。 ↓その時の記事はこちら。 今回もディープフェイク機能ですが、今度はControlnetから手軽に調整できると話題になっていて気になった『IP-Adapter FaceID』を試してみることにしました。 controlnetの新機能なので、ReActorを使ったことがあれば特に何もすることなくそのまま下記モデルをDLしてそれぞれのフォルダに入れれ

より強力になったディープフェイク機能「ReActor」を試してみる

ちょっと前(23年10月)に「roop」を使ってディープフェイク画像を作っていたのですが、それより高性能に改良されたモノが出ているらしいとのことで試してみました! ↓これが前回試した時の記事。この時もあまりの性能の良さに驚きまくったのにもっと良くなっているとはどういうこと…?? 改良版の名前は「ReActor」。 roopを使ったことがあれば環境は整ってるので、extensionから下記をインストールするだけで使えます。 具体的な改善点はこちら。 色々機能も増えてすご

中学生ぶりにドット絵をつくりたい気分だったのでAI(ComfyUI)で無限に作りまくる🐤

そういえば、ハマったな〜〜〜〜〜ドッド絵。 中学くらいだったっけ、無限にドットを打ってましたね。時間のある限り。あの「MSペイント」で。 そんな記憶が蘇り、AIでもざっくり作れるような話があったのでComfyUIで試してみました! 作り放題!たのしい🐤 一個一個ドットを打って作るのもたのしいけど、どんどんAIで作り上げるのもたのしいです! 今回参考にさせていただいたのはComfyUIのこちらのワークフロー。高速生成です。 このあとは時間を忘れて楽しんでいた一部を載せて

改めてComfyUIでstable zero123の3D画像生成を試してみた記録

前回stable zero123の動画生成を試してみました。 この時はできたけど、ちょっとブレがあるかな~といった感じ。 まだ動画はしょうがないですが、静止画をきっちり作れるならそれも試してみようということで、今回もComfyUIでやってみました! 今回のワークフローは公式のものを使っています。 それでは画像を用意。 まさにそのフォルムです! 柄がきっちり別れちゃいましたが、それはそれで味がある、うん。 ほかの角度からもやってみようと思います。

ComfyUIでstable zero123の3D動画生成を試してみた記録

12月、ちょっと体調を崩したり師走で忙しかったりしてて気づいたらStable Zero123なる高品質3Dオブジェクト生成モデルが発表されているではないですか…! stable-zero123のモデルはこちらから。 もう新年になってしまいましたが、これを早速いじってみたいと思います!どうやらすでにComfyUIでサポートされたているみたいなので良さげなnodeを検索。 今回はこちらのOlivioSarikasさんのComfyUIのworkflowでやってみたいと思います

生成AI画像からデプスをとって3D化して楽しむやつを試してみた記録

なんとなく生成した画像を3D化するのってどうやるんだろう~と思いいろいろやり方を調べてざっくり作ってみた記録です🌳 参考にさせていただいたのはmieki256's Homepageさんのこの記事です。 すごくわかりやすく書いてあって素晴らしい記事です!ありがたや〜! まずはAI生成からとりあえずイラストを用意しようかということで、chatGPTのDALL-E3さんにいい感じの森の画像を作ってもらいました。 記事に従い、出来上がった画像をA1111のControlNetに