見出し画像

【生成AIニュース】『Dream Machine v1.6』『LVCD』『Napkin.aiアップデート』他

まいどです。
本日の生成AIニュース。


■Dream Machine v1.6


動画生成AIであるDream Machineがアップデートされ、推論が10 倍高速化され、20秒未満で動画が生成可能になりました。

https://lumalabs.ai/dream-machine

■LVCD


線画の動画に色を付けるための新しいフレームワークです。
従来、画像1枚ずつに色を付けていく方法が主流でしたが、LVCDは動画全体を対象に、より自然で滑らかな色付けを行うことができます。

■Napkin.aiアップデート


プレゼンテーション資料の作成をオールインワンで行える図解生成AI『Napkin.ai』がアップデートされ、新しいビジュアルカスタマイズ機能が実装され、ビジュアルをこれまで以上に簡単にカスタマイズできるようになりました。

■Digital Twin Catalog


3D オブジェクトの再構築研究において、世界最高水準のデータセットです。
物理的な物体とほぼ同一の精度を持つほど高精度で、更に多様性を持ち、データの種類も豊富です。

■WiLoR


マルチハンド検出と再構築のためのフレームワークです。
リアルタイムの検出と局在化モデルを使用することで、WiLoR は複数のハンドを高忠実度に再構築することができます。

■JoyHallo


中国語や英語の音声から高品質なビデオを生成できるモデルです。
複雑な口の動きを正確に再現することができます。

■Fotographer AI


高品質なビジュアル制作を実現する、簡単なAIツールである『FotographerAI』で、画像とプロンプトから、わずか数秒で簡単に短いビデオを生成できるようになりました。

■CogView3


Apache 2.0 ライセンスの小型拡散モデルで、リレー拡散と呼ばれる手法を用いたテキストから画像生成をするシステムです。

■whisper-large-v3-turbo


Transformersでサポートされ、モデルチェックポイントは809Mのパラメータ(Large v3の約8倍高速で、2倍小さい)で、多言語対応しているそうです。

https://huggingface.co/spaces/hf-audio/whisper-large-v3-turbo

https://github.com/openai/whisper/pull/2361/files

■Organizer


AI を活用してファイルを整理するソフトウェアです。
Llama 3.2 がデフォルト モデルになりました。

■ソフトバンク、OpenAIに5億ドルを投資


ソフトバンクは、OpenAIへの初投資を検討しています。
ChatGPTメーカーを1500億ドルという驚異的な評価額で、第2のビジョンファンドを通じて5億ドルをチップインすることに合意したとの事。


本日は以上となります。
それでは、また。

この記事が気に入ったらサポートをしてみませんか?