今週の気になったテック関連のトピック 2024-01-05

2024年1月5日 17:33

明けましておめでとうございます。

個人的に今週目にして気になったトピックです。テックを軸にしつつ、私の興味に基づいてあえて周辺領域を含んだ雑多な内容を目指します。元々はチームの内部に向けて共有していたものを外に出してみる実験です。

今年もちょこちょこやり方やフォーマットなど変えつつ、継続してみようかなと。とりあえず週に1度まとめてみるのではなく、毎朝30分も情報みる時間に当てることにしました。タイトルのフォーマットも変えてみました。ネタは少なめに、でも軸はテックに置きつつも、接続される範囲はジャンプしたものになるといいなと思います。

で、流石に年末年始でこの1週間は個人的にはそれほど大きく気になったものはなくて（GPTs Storeのアナウンスとかはあったけど公開はまだだし）、12月の動画だが、NVIDIAが2023年の主要な研究プロジェクト10選をまとめた動画を公開してるのでおさらいしてみます。英語の読み間違いはあるかもしれないので注意。

Top 10 NVIDIA Research Projects of 2023

Neuralangelo: High-Fidelity Neural Surface Reconstruction

2Dビデオクリップ（つまり普通の動画）から詳細な3Dシーンを構築する研究。彫刻を始め建築などの大きな対象も対応できる。ガラスの窓や大理石などの質感も変換できる能力が従来の手法より優れている。

Magic3D: High-Resolution Text-to-3D Content Creation

プロンプトのテキストから3Dモデルを生成する研究。既存手法より高速で品質も高い。すでにある粗いモデルに対してプロンプトで修正をすることもできる。

Hair Simulation: Interactive Hair Simulation on the GPU Using ADMM

リアルタイムで高解像度の数万本の毛髪をシュミュレートする研究。GPUに最適化されておりCPUベースに比べて大幅にパフォーマンスが向上している。リアルタイムな高品質なシミュレーションが可能になる。

Eureka: Human-Level Reward Design via Coding Large Language Models

ロボットに複雑なスキルを教えることができるAIエージェント。ロボットを訓練するための報酬アルゴリズムを生成する。引き出しやキャビネットを開くこと、ボールを投げてキャッチすることなども教えることができた。

Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models

高品質かつ高解像度のテキストからの動画生成。最大解像度1280 x 2048を出力可能。先行研究と比較して、高解像度であること、時間的に一貫性があるビデオを生成する能力が高いことが挙げられている。

Text2Materials: Using Text or Image Prompts to Generate Custom Textured Materials

テキストからマテリアルを生成する研究。高速かつ細かいコントロールをしつつ生成を可能とする。

CALM: Conditional Adversarial Latent Models for Directable Virtual Characters

ユーザーが指示するバーチャルキャラクターの動作を生成するための条件付き逆生成モデル。従来の研究と比べて、CALMは複数の動きを同時に学習し、より多様な動作と直接的な制御を実現する。

Vid2Player3D: Learning Physically Simulated Tennis Skills from Broadcast Videos

放送されたテニスのビデオからテニスのスキルを学習するシステムの研究。具体的には選手の動きを解析し、そのデータを使ってシミュレーション上のキャラクターがリアルなテニスの動作を再現できる。先行研究に比べて、以前はモーキャプデータから学習していたが、本研究では直接ビデオから学習している。

FlexiCubes: Flexible Isosurface Extraction for Gradient-Based Mesh Optimization

次世代のメッシュ最適化手法。先行研究に比べて、より高い柔軟性があり、複雑な形状やシャープな形状を効率的に表現できる。

eDiff-I: Text-to-Image Diffusion Models with an Ensemble of Expert Denoisers

テキストからの画像生成の研究。先行研究よりも画像テキストの整合性と視覚的品質の向上を実現している。

この記事が気に入ったらサポートをしてみませんか？