見出し画像

【生成AIニュース】『txtai』『VideoGen』『StreamingT2V』他

まいどです。
それでは、本日の生成AIニュース。


■txtai


検索、言語モデル連携、言語モデルを使った処理の流れなどができる、多機能な埋め込みデータベースです。
Pythonで利用でき、ほかの言語からも利用するためのライブラリが用意されています。

■VideoGen


生成から編集可能までな動画生成AIです。
多言語の音声生成も対応しているので、そのまま音声が流れる動画を生成する事も可能だとの事。

https://videogen.io/

■StreamingT2V


動画生成AIモデル「StreamingSVD」がオープンソースでリリースされました。

■AnythingLLM


デスクトップ用オールインワンAIアプリケーションです。
あらゆるLLM、あらゆるドキュメント、あらゆるエージェントを統合した、完全プライベートなAIアプリケーションで、Windows、MacOS、Linuxに対応しており、デスクトップに単一のアプリケーションとしてインストールすることができます。

■AI Codex


Cursor AI が過去の失敗から学習し、能力を向上させるための「学習ノート」のような機能です。
エラーの記録、エラーの分析、経験の学習、エラーの回避と言うステップを踏み、カーソルAIの自己改善システムを行います。

■DepthCrafter


オープンワールドビデオのテクスチャと一致する、長時間の深度シーケンスを生成するワークフローです。
従来のモノクロ深度推定は静止画像に限定されていましたが、DepthCrafterはカメラの動きや長さなど、コンテンツの多様性に富むオープンワールドビデオにも適用可能です。

■G3DST


ニューラルラディアンスフィールド(NeRF)を用いて、シーンやスタイルごとに最適化することなく、ビュー一貫性のあるスタイライズされた新しいビューをレンダリングするワークフローです。

■Cube


AIで生成したどんなアセットでも物理シミュレーションを実行できる機能が追加されました。
ワンクリックで実行が出来、ラフスケッチからすぐに車の空気抵抗をテストすることができるようになるそうです。

■Reflection 70B


GPT-4oやClaude 3.5を超えた、最強のオープンソースのAIモデルがリリースされたとの事。
尚、既にダウンロードされた方も、直後に修正が入ったので、もう一度ダウンロードをお試しください。
FP16バージョンも近日公開予定だそうです。

■AlphaProteo


Google DeepMindが開発した新しいAIモデルで、タンパク質設計を加速させ、新しい治療法の開発や、生命科学の理解を深めるための強力なツールとなることが期待されます。

■Florence-2-base-PromptGen v1.5


画像に対して詳細なキャプションを生成するモデルです。
MiaoshouAI Taggerの一部として使われることが想定されています。

■DeepSeek-V2.5


DeepSeek-V2-Chat と DeepSeek-Coder-V2-Instruct の機能を組み合わせた強化版のモデルです。これにより、テキスト生成だけでなく、コードを書くこともできるようになり、様々なタスクに対してより柔軟に利用できます。

■Flux Latent Upscaler


Fluxの生成画像の解像度を上げつつ、構図や細かいディテールを維持したい場合に役立つツールです。
ただし、完全に自動化されたツールではなく、設定や微調整が必要になる点に注意してください。

■1999 Digital Camera Style


Flux用のLoRAで、オリンパスD-450 Zoomデジタルカメラの、特徴的なソフトコントラスト、限られたダイナミックレンジ、色のにじみ、レンズの歪み、わずかな粒子効果など、カメラの効果を再現するLoRAです。

■FLUX - Oil painting


こちらもFlux用のLoRAで、油絵タッチを再現します。

■YouTubeがAIが生成した歌のコンテンツを検出する新しいツールを追加


YouTubeは、AI生成コンテンツの増加に対処するために、新しいツールを追加したとの事です。
Content IDと呼ばれるYouTubeの自動コンテンツ識別システムに、合成歌唱識別ツールが追加され、プラットフォームのパートナーがYouTube上のAI生成コンテンツを自動的に検出して管理できるようになります。


本日は以上となります。
それでは、また。

この記事が気に入ったらサポートをしてみませんか?