【生成AIニュース】『Dream Machine v1.6』『LVCD』『Napkin.aiアップデート』他

2024年10月1日 20:38

まいどです。
本日の生成AIニュース。

■Dream Machine v1.6

動画生成AIであるDream Machineがアップデートされ、推論が10 倍高速化され、20秒未満で動画が生成可能になりました。

🚀 Welcome to the era of Hyperfast video generation: with 10x faster inference, you can now generate full-quality Dream Machine v1.6 clips in under 20 seconds. No "turbo" or "distilled" models - just uncompromised quality. Available today to all subscribers and API customers. pic.twitter.com/9mc5vJrTf0
— Luma AI (@LumaLabsAI) September 30, 2024

https://lumalabs.ai/dream-machine

■LVCD

線画の動画に色を付けるための新しいフレームワークです。
従来、画像1枚ずつに色を付けていく方法が主流でしたが、LVCDは動画全体を対象に、より自然で滑らかな色付けを行うことができます。

■Napkin.aiアップデート

プレゼンテーション資料の作成をオールインワンで行える図解生成AI『Napkin.ai』がアップデートされ、新しいビジュアルカスタマイズ機能が実装され、ビジュアルをこれまで以上に簡単にカスタマイズできるようになりました。

We’re excited to announce that new visual customizations features are now live on Napkin, making it easier than ever to personalize your visuals 🎨

✅ Choose from new fonts like Arial, Times New Roman, Noto Serif Japanese, M PLUS Rounded 1c and more
✅ Add any color using our… pic.twitter.com/DiIxLHlEYA
— Napkin AI (@napkin_ai) October 1, 2024

■Digital Twin Catalog

3D オブジェクトの再構築研究において、世界最高水準のデータセットです。
物理的な物体とほぼ同一の精度を持つほど高精度で、更に多様性を持ち、データの種類も豊富です。

■WiLoR

マルチハンド検出と再構築のためのフレームワークです。
リアルタイムの検出と局在化モデルを使用することで、WiLoR は複数のハンドを高忠実度に再構築することができます。

■JoyHallo

中国語や英語の音声から高品質なビデオを生成できるモデルです。
複雑な口の動きを正確に再現することができます。

■Fotographer AI

高品質なビジュアル制作を実現する、簡単なAIツールである『FotographerAI』で、画像とプロンプトから、わずか数秒で簡単に短いビデオを生成できるようになりました。

🎉 Image to Video Feature Released! 🎉

You can now easily generate a short video from your favorite image + prompt in just a few seconds! 🎥

Transform product images into videos to enhance the visual appeal of your brand! pic.twitter.com/6WThY68Jno
— Fotographer AI (@FotographerAI) September 27, 2024

■CogView3

Apache 2.0 ライセンスの小型拡散モデルで、リレー拡散と呼ばれる手法を用いたテキストから画像生成をするシステムです。

■whisper-large-v3-turbo

Transformersでサポートされ、モデルチェックポイントは809Mのパラメータ(Large v3の約8倍高速で、2倍小さい)で、多言語対応しているそうです。

https://huggingface.co/spaces/hf-audio/whisper-large-v3-turbo

https://github.com/openai/whisper/pull/2361/files

■Organizer

AI を活用してファイルを整理するソフトウェアです。
Llama 3.2 がデフォルトモデルになりました。

■ソフトバンク、OpenAIに5億ドルを投資

ソフトバンクは、OpenAIへの初投資を検討しています。
ChatGPTメーカーを1500億ドルという驚異的な評価額で、第2のビジョンファンドを通じて5億ドルをチップインすることに合意したとの事。

本日は以上となります。
それでは、また。

この記事が気に入ったらサポートをしてみませんか？