「#ベンチマーク」の人気タグ記事一覧｜note ――つくる、つながる、とどける。

【6/14 最終追記】FF14 黄金ベンチマーク再リリースまでの対応について色々ツッコミたい

1か月前

505

マシュー・サイド著「失敗の科学」を読み解く - ⑤ボクらの「マージナル・ゲイン」

科学的に考える人

1か月前

20

『仕事で、遊ぼう。』

6か月前

279

【4.2LTS】Blenderベンチマーク

5日前

6

【論文瞬読】AIエージェントの進化！SELFGOALで高レベル目標を賢く達成

3週間前

13

商用利用可能な130億パラメータの日本語LLM「Tanuki-ZeRo」を一般公開【代表的な日本語ベンチマークで世界6位: オープンモデルで1位相当､GPT3.5やClaude v2を一部凌駕, 23/3/30時点】

3か月前

44

【論文瞬読】複数のAI頭脳を組み合わせて超絶パワーアップ！？新技術「Mixture-of-Agents」が示す驚きの可能性

1か月前

14

パソコン画面のリドロー（書き換え）に対して待てる時間は7秒が限界とされた。これは約30年前のベンチマーク。今では僅か1秒。3秒となると他の行動に移るらしい。一時停止や踏切で3秒止まれないドライバーを散見する。高速PCやスマホに慣れた時代の象徴なのだろうか？待てない病が蔓延？

Jオヤジ｜心の灯つけ役｜cocoro♥lighter

2日前

16

BIツールの限界：目標値やベンチマークがなければ無意味

データ分析やりたくて人事部に入ったわけじゃないのに

1か月前

8

【論文瞬読】大規模言語モデルの推論能力の限界：常識問題で明らかになった意外な弱点

3週間前

15

合成データを利用したLLMの開発

3か月前

15

【論文瞬読】オープンソースの評価言語モデル「PROMETHEUS 2」登場！複数の評価方式に対応し、人間レベルの評価を実現

2か月前

11

【論文瞬読】マルチモーダルAIの最前線：大規模言語モデルにおけるHallucinationの課題と展望

2か月前

10

304：【成長】継続していく上で大事にしてきたこと３つ！

禰宜田　眞(Shin Negita)継続は力なり

6か月前

54

10b程度のモデルをファインチューニングする日記 (逐次更新)

3か月前

16

【論文瞬読】大規模言語モデルの算術推論能力を適切に評価する新手法－ベンチマークデータの汚染と過学習の問題に迫る－

2か月前

10

SFはビジョン・ゼロの達成に向け都市間比較のためのダッシュボードを整備

Local Knowledge Platform

2週間前

3

小説執筆に特化するLLMベンチマークを9パターン考えてみた

7日前

7

【論文瞬読】複数のAIモデルを組み合わせて評価！大規模言語モデルの新しい評価手法「PoLL」とは？

2か月前

11

ブルームバーグが構築した世界30都市を対象にしたデータダッシュボード

Local Knowledge Platform

2か月前

5