![見出し画像](https://assets.st-note.com/production/uploads/images/133021705/rectangle_large_type_2_404423a210b7cc982152c3273602719d.png?width=1200)
WSL2でTripoSRを試してみる
「Tripo AI と提携し、LRM: Large Reconstruction Model For Single Image to 3D にインスパイアされた高速3Dオブジェクト再構築モデル」であるTripoSRを試してみます。
使用するPCはドスパラさんの「GALLERIA UL9C-R49」。スペックは
・CPU: Intel® Core™ i9-13900HX Processor
・Mem: 64 GB
・GPU: NVIDIA® GeForce RTX™ 4090 Laptop GPU(16GB)・GPU: NVIDIA® GeForce RTX™ 4090 (24GB)
・OS: Ubuntu22.04 on WSL2(Windows 11)
です。
1. 準備
python3 -m venv triposr
cd $_
source bin/activate
リポジトリをクローン。
git clone https://github.com/VAST-AI-Research/TripoSR
cd TripoSR
パッケージのインストール。gradioで試すので、インストールしておきます。
pip install torch
pip install -r requirements.txt
pip install gradio
2. 試してみる
起動する
Gradioを起動します。
python gradio_app.py
起動しました。
![](https://assets.st-note.com/img/1709609669064-gEbNbfaKQb.png?width=1200)
画像を指定する
入力画像にサンプルのハンバーガーを指定して、Generateボタンを押下します。生成されたobjファイルを保存して、MeshLab で読み込ませてぐるぐる回した動画がこちら。
まずはサンプルにもあるハンバーガーをもとにして生成されたobjファイルをMeshLabに読み込ませてぐるぐる回すの動画。 pic.twitter.com/MA9XigaXDa
— NOGUCHI, Shoji (@noguchis) March 5, 2024
かなり精巧ですね。
続いて、ネコ型パイロットをもとに生成してみましょう。
![](https://assets.st-note.com/img/1709643846550-I98ttSd0OA.png?width=1200)
続いて、以前作成した何からしき猫型の画像をもとにして生成されたobjをぐるぐる回すの動画。 pic.twitter.com/qGdyEAFrOd
— NOGUCHI, Shoji (@noguchis) March 5, 2024
後ろ姿が補間されているのがすごい。
3. まとめ
VRAM使用量は12.2GBでした。objの生成時間は3秒程度。
![](https://assets.st-note.com/img/1709644734955-uZmxbxAPLH.png)
1枚の画像から3Dモデルを数秒で生成、しかもこの精巧さは、すごいです。
おまけ
某国宰相。結構似てます。
この記事が気に入ったらサポートをしてみませんか?