最新AI研究&検証

本

最新AIの最前線に立つ技術、理論、応用を深掘りするマガジンです。検証結果や研究の記事をまとめています。

運営しているクリエイター: SUTO💡

画像と音声からリップシンクを生成するAIツール「DreamTalk」で遊んでみる👄

AliBabaが公開している画像を音声に合わせて喋らせるAIツール（トーキングヘッド生成フレームワーク）「DreamTalk」。 AIサービスではHeyGenやDIDなどもありますが、オープンソースで試すことができる状態でしたので試してみました！ Githubのページはこちら。デモはHugging Faceから！早速アクセスしてみます。アバター画像、音声ファイル、感情を選んで押すだけで良いUI ということで大変わかりやすいですね！それじゃ早速いじって行きますか

現時点オープンソース最強のディープフェイク動画制作ツール「FaceFusion」をいじってみる

高速かつ簡単にディープフェイク動画を作成できると話題の「FaceFusion」。いろんなところで悪用厳禁！と言われているので、どんなものだろうかと試してみました。 githubのページはこちら↓ インストールして立ち上げた画面は結構細かく設定項目がありそうですが、sourceとtargetを入れてSTART押せばできそうな感じがあり、これもUIがわかりやすくて素敵です。今回もディープフェイクを試すモデルとしてモナリザさんにご登場いただきます！それでは早速この画像

動画の背景抜きに便利そうな🎞️ Video Background Removal Tool 🎥を試して合成した動画をザクっと作ってみる

Hugging Faceでたまたま便利そうなAIツールを発見してしまいました。その名も「Video Background Removal Tool」。そのままですね！動画の背景削除ツールです！これがあるとクロマキーによるキーイング処理(合成)が楽になりそう〜！ってことで試してみました！デモ画面でのUIはやはり超シンプル。今回はガチャガチャでGETした寝てる白猫ちゃんの動画を撮って試したいと思います。動画を撮ってセットして… ※タイムアウト処理を避けたく高

「LGM」という2D-to-3Dもあったらしいので試して「TripoSR」と比較してみた☁️

前回、2D-to-3DのTripoSRを試してましたが、LGMという2D-to-3Dのも2月上旬に話題になっていたらしく、今更ですが触ってみました。普通にデモがHugging Faceにあったのでここからサクッと試してみようと思います！早速アクセス！これも使いやすそうです！それではTripoSRで試した黒猫ちゃんで試してみたいと思います。 TripoSRを試した時の記事はこちら↓ 左側に画像を入れて、一旦promptはなしでそのままジェネレート。これもあ

2D-to-3Dの「TripoSR」が話題になったので試してARで召喚してみたよ🐱

Tripo × Stability AI が公開した3D生成AIモデル「TripoSR」。これが精度よく単一画像からの3Dオブジェクト生成をしてくれると話題になってたので早速試してみようと思います。詳しくはweelさんの記事がとても分かりやすかったので貼っておきます！インストール後の画面はこんな感じでした。それではまずStable Diffusion Web UIで黒猫ちゃんを呼んで入れてみる。すぐ3D化できちゃいます。まじの１秒です。茶色い猫でも試して