人気の記事一覧
ローカルマルチモーダルを簡単に使えるAPIを公開。LLaVA-Next(旧1.6)でAPIサーバを構築
【無料】ローカルPCで動いて画像を理解する目を持ったOSSの生成AI 【LLaVA】(マルチモーダルLLM)
論文紹介: LLaVA-1.5 (Improved Baselines with Visual Instruction Tuning)
NVIDIA Jetson AGX Orin Developer Kitで画像分析が可能なLLMのLLaVA1.5-13bを実装する方法
GPT4v越えと噂のLLaVA 1.5をllamafileを使いローカルMacで試す
Google Colab で LLaVA-1.5 を試す
Llama2ベースのLLaVAが画像のプロンプトを考えられるようになった
動画を文章で説明する『Video-LLaVA』のデモ版を試してみた。
LLaVA-1.5をDiscord botに組み込んでみた
[旅するAI bot]リアル+2Dキャラクタimage2image画像合成にマルチモーダルAIを使って画像のリアルさを強化する
【LLaVA 1.5】オープンソース版GPT4-Vの使い方~比較レビューまで
My LLMこと始め ② MacでLLava1.5