生成画像に驚異的な一貫性を持たせる「DreamTuner」他 / Catch up on AI 2023.12.23

2023年12月23日 20:13

Pick up

ByteDanceがリリースしたDreamTuner。画像をテキストで操作する際に一貫性を保てない問題がありましたが、DreamTunerではその問題を解決できる可能性。

DreamTuner: Single Image is Enough for
Subject Driven Generation
Project：https://dreamtuner-diffusion.github.io
Paper：https://arxiv.org/abs/2312.13691

【キャラのテキスト操作の一貫性が大幅に向上】
ByteDanceがリリースしたDreamTunerが凄い。

イメージからプロンプトで背景を変えたり、ポーズや表情を変えた際の一貫性が飛躍的に向上。キャラクターを指定して様々な指示をテキストで出しても破綻がほぼ無い。

服装も完璧！

続く>>#生成AI pic.twitter.com/B2ahcIe7vg
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) December 23, 2023

【驚異的な一貫性を利用してダンス生成】#DreamTuner の驚異的な一貫性を利用して、ControlNetのOpenposeを掛け合わせて、ダンスムービーも生成可能。

1フレームごと生成しているだけなのですが、DreamTunerで一貫性を保つことで成立...。
これは...凄まじい。#生成AI https://t.co/PFGAExg1Bg pic.twitter.com/IfUqcGmMpY
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) December 23, 2023

Catch up on AI

犬や馬、キャラ、椅子までポーズ推定が可能「Pose Anything」

【犬や馬、キャラ、椅子までポーズ推定が可能】
Pose Anythingは、あらゆる物体・生物のポース推定が可能なモデル。全身だけで無く、顔の表情などの目と口のバランスも推定できる。

これが進めば、複雑な「馬が走る」などの動画もAIで破綻なく自然に可能になるかもしれない。

続く>>#生成AI pic.twitter.com/WOpGI3Xjm4
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) December 23, 2023

アリババを待ちきれず、アンオフィシャルで「AnimateAnyone-unofficial」

【アリババを待ちきれず、アンオフィシャルで】
世界中で話題になった、ダンス生成AIのAnimate Anyoneをmagic-animateとAnimateDiff を利用し、非公式で構築。急速に発展させているのがAnimateAnyone-unofficial。

現在第2段階のトレーニングとテストを行っているそうです。

続く>>#生成AI pic.twitter.com/wsDvGsjar6
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) December 23, 2023

画像から高品質なムービーを生成「Image2Motion」

【画像から高品質なムービーを生成】@LeonardoAI_ のImage2Motionがかなり良さそう。もともとのインプットをかなり忠実に守り、一貫性が非常に高い動画を生成している。

フォトリアルの描写が特に素晴らしい！現在ベータとのことです。#生成AI #AI動画 pic.twitter.com/oxKwIbFLxJ
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) December 23, 2023

テキストから3Dルームを生成「ShowRoom3D」

【テキストから3Dルームを生成】
ShowRoom3Dは、テキストプロンプトから高品質な3Dルームシーンを生成する技術。 MVDiffusionを利用して、3Dルームスケールシーンを最適化。

カメラの制御も可能でさらに、自由視点で見ることも可能です。

続く>>#生成AI #3D #AI pic.twitter.com/br0G5DSxMr
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) December 23, 2023

整合性が取れたアニメを可能にするモデル　PIA

【整合性が取れたアニメを可能にするモデル】
PIAは、画像の整合性、プロンプトによる一貫性のあるモーション制御を可能にするモデル。特別なチューニングが必要なく利用可能。

かなりクオリティが高く、様々な表現で破綻が無いアニメーションが生成可能です。

続く>>#生成AI #動画生成AI pic.twitter.com/nnOtbOX5iA
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) December 22, 2023

IP-Adapterを利用して服装も再現

【IP-Adapterを利用して服装を再現】
ComfyUI+IP-Adapterで、顔だけでは無く、服装も完全に再現。
それぞれのボディーパーツに区分けて利用することで、全て再現した人物のポーズ違いを生成。

生成AIは奥が深い。リアルな人物だけでは無くてイラストもイケるっぽい！

続く>>#生成AI #画像生成AI https://t.co/W5TkFPxyP4
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) December 23, 2023

AIを教えるAIショート動画音楽、声、セリフ全てAIで制作

【AIを教えるAIショート動画】
前後は人間が出演していますが、画像生成AIでコンテンツが爆発的に増えたように、音楽、声、セリフ全てAIで制作されると、飛躍的に流通するコンテンツは増えそう。

是非音声ONでご覧ください！

利用されたAIツールは続きから>>#生成AI pic.twitter.com/RC0UEoeNHL
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) December 23, 2023

AIのNewsやアートワーク情報を更新中⚡

X（Twitter）ではAIの最新情報を発信中🐦

Tweets by taziku_co

この記事が気に入ったらサポートをしてみませんか？