人気の記事一覧
LLMOps:基盤モデルに基づくアプリケーション開発のワークフロー
Ferret-v2: An Improved Baseline for Referring and Grounding with Large Language Models
【データサイエンティストさん🌟必見✨】pythonコードで実行していることをChatGPTで読み解いてPowerPointでまとめてみた(機械学習「モデル評価と改善」)
〜初心者がPythonで小売データ分析をやってみた〜
Pythonでフィットネスクラブによる退会予測をしてみた【Aidemy成果物】
KNVQA: A Benchmark for evaluation knowledge-based VQA
UltraEval: A Lightweight Platform for Flexible and Comprehensive Evaluation for LLMs
DesignQA: A Multimodal Benchmark for Evaluating Large Language Models' Understanding of Engineering Documentation
Advancing Spatial Reasoning in Large Language Models: An In-Depth Evaluation and Enhancement Using the StepGame Benchmark
Lo-Hi: Practical ML Drug Discovery Benchmark
A Comprehensive Performance Study of Large Language Models on Novel AI Accelerators
オープンソースLLMの日本語評価結果 - W&Bローンチで誰でも再現可能に
振り返るとそこには「Python機械学習プログラミング」②承