人気の記事一覧

SakanaAI EvoLLM-JP-v1-7Bを試した。これからのマルチモーダルAIに必要なデータについて

1か月前

Gemini1.5 Proが一般公開された

【Reka Core】最先端のマルチモーダルAI の実力を徹底検証!🔍動画もPDFも解析可能

『Claude、ChatGPT、Geminiで「材料写真からレシピ」対決!スマホに最適化した写真入力×専門特化AIがトレンドに!?』~【web3&AI-テックビジネスのアイディアのタネ】2024.3.19

誰でも使えるGoogle AI Studioの使い方

4か月前

ローカルマルチモーダルを簡単に使えるAPIを公開。LLaVA-Next(旧1.6)でAPIサーバを構築

GPT-4Vのマルチモーダル機能を利用してオセロゲームを生成させた話

3か月前

OpenAIのgpt-4-vision-previewに画像を投げてどんなことをしてくれるのか試してみた

🌈xAIのGrokが「Grok-1.5V」にバージョンアップとイーロン・マスク氏が発表 同社初のマルチモーダルで画像認識ができるようになったようね 他社のAIと比べても優れてるっていう話 その真相はちょっとどうかしら?って思うけど

【論文瞬読】エキスパートAGIの実現に向けたベンチマークの提案

1か月前

Google Colab で heron-blip-v1 を試す

1か月前

LLaVA-1.6を使ってみた。日本語もOKなマルチモーダルLLM

AIはわたしたちのバディになる~富士通のAI戦略メッセージが意味するもの~

とりあえずAIを挟んでみよう②<準備編Gemini>

1か月前

【無料】ローカルPCで動いて画像を理解する目を持ったOSSの生成AI 【LLaVA】(マルチモーダルLLM)

2週間前

高性能なマルチモーダル大規模言語モデル:MM1についての論文紹介

1か月前

#126 「しあわせ探求〇」はのぼる⛰️

イノベーションソリューションシステム

【論文瞬読】マルチモーダル言語モデルの構築方法を徹底分析!Apple社の研究チームが重要な知見を公開

1か月前

ChatGPTとの連携を考えてみる③

2か月前