Duolando: 音楽と人間の動きに同期したダンスパートナーの動きを自動生成するAIモデル

2024年4月3日 19:38

はじめに

どうも皆さん！料理は見た目より味重視のタイプの女、葉加瀬あいです！

今回は、Duolandoという音楽とリーダーの動きに同期したダンスパートナーの動きを自動生成するAIモデルについて詳しく見ていきましょう！

pic.twitter.com/tpLMV5s7hM
— 葉加瀬あい (AI-Hakase) ✎. AI作曲家＋AI解説＋保護猫活動 🐈の理系女子🎈 (@ai_hakase_) April 3, 2024

なお、私の記事を読む上での注意事項などをこちらで説明しておりますので、以下のプロフィール記事をご一読いただいた上で閲覧するようお願いいたします。

それでは、早速続きを解説していきたいと思います！

Duolandoは、GPT（Generative Pre-trained Transformer）ベースのモデルで、リードダンサーの動きと音楽リズムに同期したダンスパートナー（フォロワー）の反応する動きを自動的に予測・生成します。

このモデルは、S-Lab、NTUsg（Nanyang Technological University, Singapore）、Lexica、SenseTime、Shanghai AI Laboratoryの共同開発によるものです。

Duolandoは、音楽、リーダーの動き、フォロワーの動きの協調情報を条件として、その後のトークン化された動きを自己回帰的に予測します。

さらに、オフポリシー強化学習戦略を用いて、未知の条件（音楽とリーダーの動き）に対しても安定した結果を生成できるようにモデルを強化しています。

ここで、自己回帰とは、過去の出力を入力として次の出力を予測する手法のことを指します。

また、オフポリシー強化学習とは、別のポリシー（行動選択戦略）で収集されたデータを用いて学習する手法のことを指します。

Duolandoを使えば、以下のようなことが可能になります。

pic.twitter.com/t7zoAhPKyp
— 葉加瀬あい (AI-Hakase) ✎. AI作曲家＋AI解説＋保護猫活動 🐈の理系女子🎈 (@ai_hakase_) April 3, 2024

さらに、Duolandoを3D CGやAnimateDiffなどのAI技術と組み合わせることで、リアルなライブよりももっと臨場感のあるリアルなメタバースライブができる可能性があります！

例えば、このような感じでAIを使って全く別のテイストのリアルなキャラクターを作成することもできますので、すごく夢が広がりますよね！

pic.twitter.com/RHQQTHfMIN
— 葉加瀬あい (AI-Hakase) ✎. AI作曲家＋AI解説＋保護猫活動 🐈の理系女子🎈 (@ai_hakase_) April 3, 2024

Duolandoの開発には、大規模で多様なデュエットインタラクティブダンスのデータセットDD100が構築されました。

これは、約117分のプロダンサーのパフォーマンスを録画したものです。

既存のソロやグループダンス生成タスクとは異なり、デュエットダンスシナリオでは、2人の参加者間の相互作用の度合いが高まり、ポーズとポジションの両方で繊細な調整が必要となります。

また、Duolandoでは、人間が定義したデータに導かれながら、分布外のサンプリングから実行可能な軌道を探索することを可能にするオフポリシー強化学習戦略が考案されています。

これによってとてもリアルなダンスおつり出しているということですね！

以上が、Duolandoについての概要です。

Duolandoに関する詳細な情報は、以下のリンクからご確認ください。

Duolandoの登場により、ダンスの世界がどのように変化していくのか、とても楽しみですね！

いかがだったでしょうか。以上で本稿の解説を終了します。
今後も生成AIに関する記事を投稿していく予定ですので、フォロー・いいね をいただけると非常に励みになります。

また、私のプロフィール記事に関しても是非一読ください。

また、私はこういった生成AI技術の解説以外にも、保護猫活動なども行っておりますので、日々の応援なども含め、少額でも下記のリンクからご支援いただけますと幸いです。

ここまでご覧いただきありがとうございました！充実した生成AIライフをお楽しみください！

AIとやってみた

この記事が気に入ったらサポートをしてみませんか？