【生成AIニュース】『txtai』『VideoGen』『StreamingT2V』他

2024年9月7日 20:41

まいどです。
それでは、本日の生成AIニュース。

■txtai

検索、言語モデル連携、言語モデルを使った処理の流れなどができる、多機能な埋め込みデータベースです。
Pythonで利用でき、ほかの言語からも利用するためのライブラリが用意されています。

■VideoGen

生成から編集可能までな動画生成AIです。
多言語の音声生成も対応しているので、そのまま音声が流れる動画を生成する事も可能だとの事。

What if you could generate videos of anything in seconds? Not glitchy AI videos, but professional, copyright-free videos.

You can with VideoGen, https://t.co/aBhQW8mJXu pic.twitter.com/JOHS6EmpmW
— VideoGen (@VideoGenApp) August 30, 2024

https://videogen.io/

■StreamingT2V

動画生成AIモデル「StreamingSVD」がオープンソースでリリースされました。

■AnythingLLM

デスクトップ用オールインワンAIアプリケーションです。
あらゆるLLM、あらゆるドキュメント、あらゆるエージェントを統合した、完全プライベートなAIアプリケーションで、Windows、MacOS、Linuxに対応しており、デスクトップに単一のアプリケーションとしてインストールすることができます。

■AI Codex

Cursor AI が過去の失敗から学習し、能力を向上させるための「学習ノート」のような機能です。
エラーの記録、エラーの分析、経験の学習、エラーの回避と言うステップを踏み、カーソルAIの自己改善システムを行います。

酷！Cursor AI的自我提升系统：AI Codex

AI Codex类似于Cursor AI的 "学习笔记"，可以帮助其从错误中吸取教训，不断提升自身能力

特点：
1、记录错误： AI Codex会记录错误的具体情况，比如错误类型、发生时间、代码片段等
2、分析错误： AI… pic.twitter.com/DtGVJaPJ4o
— AIGCLINK (@aigclink) September 6, 2024

■DepthCrafter

オープンワールドビデオのテクスチャと一致する、長時間の深度シーケンスを生成するワークフローです。
従来のモノクロ深度推定は静止画像に限定されていましたが、DepthCrafterはカメラの動きや長さなど、コンテンツの多様性に富むオープンワールドビデオにも適用可能です。

■G3DST

ニューラルラディアンスフィールド（NeRF）を用いて、シーンやスタイルごとに最適化することなく、ビュー一貫性のあるスタイライズされた新しいビューをレンダリングするワークフローです。

■Cube

AIで生成したどんなアセットでも物理シミュレーションを実行できる機能が追加されました。
ワンクリックで実行が出来、ラフスケッチからすぐに車の空気抵抗をテストすることができるようになるそうです。

■Reflection 70B

GPT-4oやClaude 3.5を超えた、最強のオープンソースのAIモデルがリリースされたとの事。
尚、既にダウンロードされた方も、直後に修正が入ったので、もう一度ダウンロードをお試しください。
FP16バージョンも近日公開予定だそうです。

■AlphaProteo

Google DeepMindが開発した新しいAIモデルで、タンパク質設計を加速させ、新しい治療法の開発や、生命科学の理解を深めるための強力なツールとなることが期待されます。

■Florence-2-base-PromptGen v1.5

画像に対して詳細なキャプションを生成するモデルです。
MiaoshouAI Taggerの一部として使われることが想定されています。

■DeepSeek-V2.5

DeepSeek-V2-Chat と DeepSeek-Coder-V2-Instruct の機能を組み合わせた強化版のモデルです。これにより、テキスト生成だけでなく、コードを書くこともできるようになり、様々なタスクに対してより柔軟に利用できます。

■Flux Latent Upscaler

Fluxの生成画像の解像度を上げつつ、構図や細かいディテールを維持したい場合に役立つツールです。
ただし、完全に自動化されたツールではなく、設定や微調整が必要になる点に注意してください。

■1999 Digital Camera Style

Flux用のLoRAで、オリンパスD-450 Zoomデジタルカメラの、特徴的なソフトコントラスト、限られたダイナミックレンジ、色のにじみ、レンズの歪み、わずかな粒子効果など、カメラの効果を再現するLoRAです。

■FLUX - Oil painting

こちらもFlux用のLoRAで、油絵タッチを再現します。

■YouTubeがAIが生成した歌のコンテンツを検出する新しいツールを追加

YouTubeは、AI生成コンテンツの増加に対処するために、新しいツールを追加したとの事です。
Content IDと呼ばれるYouTubeの自動コンテンツ識別システムに、合成歌唱識別ツールが追加され、プラットフォームのパートナーがYouTube上のAI生成コンテンツを自動的に検出して管理できるようになります。

本日は以上となります。
それでは、また。

この記事が気に入ったらサポートをしてみませんか？