見出し画像

AIがワンステップで30倍の速さで高品質の画像を生成する「DMD」技術を開発 マサチューセッツ工科大学 (MIT)

従来のAI画像生成技術を根本的に変える、革新的な手法が誕生しました。マサチューセッツ工科大学 (MIT) の研究チームが開発した「DMD」と呼ばれる技術は、画像生成の時間をなんと30倍も高速化することができます。

現在のAIは、画像生成モデルを使って、ノイズだらけの画像に徐々に情報を加え、最終的に鮮明な画像や動画を作り出すことができます。この技術は「Stable Diffusion」や「DALL-E 2」などの人気ツールで使われており、簡単な言葉を入力するだけで、まるで夢のような画像を生成できます。しかし、高品質な画像を作るには、膨大な計算時間が必要でした。

DMDは、この時間を大幅に短縮する技術です。従来のモデルは、何百もの段階を経て少しずつ画像を完成させていましたが、DMDはたったの一段階で生成を行います。まるで「師匠」から「弟子」に技を伝授するように、複雑な既存モデルの知識を、よりシンプルな新しいモデルに凝縮させることで、高速化を実現しているのです。

この技術には多くの利点があります。まず、何よりも画像生成にかかる時間が大幅に短縮されます。デザイナーにとっては、デザイン作成時間の短縮につながり、さらには医薬品開発や3Dモデリングなど、迅速な対応が求められる分野での活用も期待できます。

生成速度だけでなく、画質も犠牲にしていません。DMDは、二段階の工夫で高品質な画像生成を実現しています。一つは、生成される画像の分布を現実世界の画像の分布に近づけるように学習させること。もう一つは、教師モデルと呼ばれる既存のモデルを活用し、本物と生成画像の違いを学習させることです。

DMDは、様々なベンチマークテストで性能を実証しました。特に、特定のカテゴリーの画像生成においては、従来の複雑なモデルと同等の品質(FIDスコア0.3)を達成しています。また、テキストからの画像生成でも、最先端の性能を示しました。

現時点では、生成される画像の品質は教師モデルの影響を受けます。そのため、DMDでは、テキストや小さな顔など、細かい部分の表現にまだ課題が残っています。しかし、より高度な教師モデルを使うことで、さらなる画質向上が期待できます。

「DMDは、これまで夢物語だった、ワンステップでの画像生成を実現します。計算コストを劇的に削減し、作業を飛躍的に高速化させるでしょう」と、MITの研究者たちは展望を語っています。

この技術は、高品質な画像編集をリアルタイムで行う道を開く可能性も秘めています。今後、DMDが様々な分野で活用されることが期待されます。

詳細内容は、MITが提供する元記事を参照してください。

【引用元】

【読み上げ】
VOICEVOX 四国めたん/No.7

この記事が気に入ったらサポートをしてみませんか?