見出し画像

WSL2でTripoSRを試してみる

「Tripo AI と提携し、LRM: Large Reconstruction Model For Single Image to 3D にインスパイアされた高速3Dオブジェクト再構築モデル」であるTripoSRを試してみます。

使用するPCはドスパラさんの「GALLERIA UL9C-R49」。スペックは
・CPU: Intel® Core™ i9-13900HX Processor
・Mem: 64 GB
・GPU: NVIDIA® GeForce RTX™ 4090 Laptop GPU(16GB)
・GPU: NVIDIA® GeForce RTX™ 4090 (24GB)
・OS: Ubuntu22.04 on WSL2(Windows 11)
です。


1. 準備

python3 -m venv triposr
cd $_
source bin/activate

リポジトリをクローン。

git clone https://github.com/VAST-AI-Research/TripoSR
cd TripoSR

パッケージのインストール。gradioで試すので、インストールしておきます。

pip install torch
pip install -r requirements.txt
pip install gradio

2. 試してみる

起動する

Gradioを起動します。

python gradio_app.py

起動しました。

画像を指定する

入力画像にサンプルのハンバーガーを指定して、Generateボタンを押下します。生成されたobjファイルを保存して、MeshLab で読み込ませてぐるぐる回した動画がこちら。

かなり精巧ですね。

続いて、ネコ型パイロットをもとに生成してみましょう。

ネコ型パイロット

後ろ姿が補間されているのがすごい。

3. まとめ

VRAM使用量は12.2GBでした。objの生成時間は3秒程度

1枚の画像から3Dモデルを数秒で生成、しかもこの精巧さは、すごいです。

おまけ

某国宰相。結構似てます。

この記事が気に入ったらサポートをしてみませんか?