ログイン
会員登録
ベンチマーク
書いてみる
関連タグ
#LLM (4,643)
#モデル (12,594)
#評価 (17,819)
#日記 (4,140,359)
#AI (294,693)
#パソコン (18,218)
人気
急上昇
新着
定番
有料のみ
403件
人気の記事一覧
【6/14 最終追記】FF14 黄金ベンチマーク再リリースまでの対応について色々ツッコミたい
Vivi
1か月前
488
マシュー・サイド著「失敗の科学」を読み解く - ⑤ボクらの「マージナル・ゲイン」
科学的に考える人
1か月前
20
『仕事で、遊ぼう。』
中野優作
6か月前
278
【論文瞬読】AIエージェントの進化!SELFGOALで高レベル目標を賢く達成
AI Nest
3週間前
11
【4.2LTS】Blenderベンチマーク
Catapp-Art3D
1日前
6
商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開 【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当、GPT3.5やClaude v2を一部凌駕, 23/3/30時点】
Kan Hatakeyama
3か月前
44
【論文瞬読】複数のAI頭脳を組み合わせて超絶パワーアップ!? 新技術「Mixture-of-Agents」が示す驚きの可能性
AI Nest
3週間前
13
BIツールの限界:目標値やベンチマークがなければ無意味
データ分析やりたくて人事部に入ったわけじゃないのに
1か月前
7
【論文瞬読】大規模言語モデルの推論能力の限界:常識問題で明らかになった意外な弱点
AI Nest
3週間前
13
合成データを利用したLLMの開発
yutohub
2か月前
14
【論文瞬読】オープンソースの評価言語モデル「PROMETHEUS 2」登場!複数の評価方式に対応し、人間レベルの評価を実現
AI Nest
2か月前
11
【論文瞬読】マルチモーダルAIの最前線:大規模言語モデルにおけるHallucinationの課題と展望
AI Nest
1か月前
10
304:【成長】継続していく上で大事にしてきたこと3つ!
禰宜田 眞(Shin Negita)継続は力なり
5か月前
54
10b程度のモデルをファインチューニングする日記 (逐次更新)
Kan Hatakeyama
3か月前
16
【論文瞬読】大規模言語モデルの算術推論能力を適切に評価する新手法-ベンチマークデータの汚染と過学習の問題に迫る-
AI Nest
2か月前
10
SFはビジョン・ゼロの達成に向け都市間比較のためのダッシュボードを整備
Local Knowledge Platform
13日前
3
【論文瞬読】複数のAIモデルを組み合わせて評価!大規模言語モデルの新しい評価手法「PoLL」とは?
AI Nest
2か月前
11
ブルームバーグが構築した世界30都市を対象にしたデータダッシュボード
Local Knowledge Platform
2か月前
5
【論文瞬読】LLMが「人の心」を理解する: 新しいベンチマークの提案
AI Nest
4か月前
14
Geminiの技術レポートを読み解く〜生成AIの最前線
Ray | 旅する魔法使い
7か月前
123