Yuya Fujiwara

Prover-Verifier ゲームによる言語モデル出力の可読性向上

原論文: https://cdn.openai.com/prover-verifier-games-improve-legibility-of-llm-outputs/legibility.pdf Claude: https://claude.site/artifacts/1fb7c1fe-2d0c-45de-9bc2-fbaacf8adee9 Jan Hendrik Kirchner*, Yining Chen*, Harri Edwards†, Jan Leike†,

計算のある生命: 単純な相互作用から整形された自己複製プログラムが出現する仕組み

原論文: [2406.19108] Computational Life: How Well-formed, Self-replicating Programs Emerge from Simple Interaction (arxiv.org) Claude Artifact: https://claude.site/artifacts/fe966da8-b0e4-471b-a8ce-68d2fcb75dca Blaise Agüera y Arcas†、Jyrki A

Yuya Fujiwa…

5日前

3
人間のような無限コンテキストLLMのためのエピソード記憶

原論文: 2407.09450 (arxiv.org) Claude Artifact 概要大規模言語モデル(LLM)は優れた能力を示していますが、長文脈の処理には課題があります。本研究では、人間の脳のエピソード記憶と事象認知の主要な側面をLLMに統合した「EM-LLM」という新しいアプローチを提案しています。これにより、計算効率を維持しながら実質的に無限の長さのコンテキストを効果的に処理できるようになりました。主要なポイントEM-LLMはトークンの連続をベイズ的驚き

Yuya Fujiwa…

6日前
STaR: 自己教師あり推論器（フルバージョン）

原論文： 2203.14465 (arxiv.org)推論による推論の自己学習 Eric Zelikman1, Yuhuai Wu12, Jesse Mu1, Noah D. Goodman1 1スタンフォード大学コンピュータサイエンス学科 2Google Research {ezelikman, yuhuai, muj, ngoodman}@stanford.edu 概要数学や常識的な質問応答などの複雑な推論タスクにおいて、段階的な「思考の連鎖」根拠を生成することで言語

Yuya Fujiwa…

9日前

2

Prover-Verifier ゲームによる言語モデル出力の可読性向上

Yuya Fujiwara

4日前

計算のある生命: 単純な相互作用から整形された自己複製プログラムが出現する仕組み

3

Yuya Fujiwara

5日前
人間のような無限コンテキストLLMのためのエピソード記憶

Yuya Fujiwara

6日前
STaR: 自己教師あり推論器（フルバージョン）

2

Yuya Fujiwara

9日前

STaR: 自己教示型推論器 - 推論による推論のブートストラップ

要旨STaRは段階的な「思考の連鎖」根拠生成を通じて、複雑な推論タスクのパフォーマンスを向上させる新しい手法です。下記の論文をまとめてみました。 2203.14465 (arxiv.org) STaRの主要プロセス少数ショットプロンプトで根拠生成誤答の場合、正解を与えて再度根拠生成（合理化）正解を導いた根拠でファインチューニング反復合理化とは合理化は、モデルが正しく回答できなかった問題に対して、正解を提供し新しい根拠を生成させるプロセスです。これにより、モ

Yuya Fujiwa…

9日前

1
STaR: 自己教示型推論器 - 推論による推論のブートストラップ

1

Yuya Fujiwara

9日前
Monte Carlo Tree Search Self-Improvement (MCTSr) Algorithm: 革新的な数学的推論の最前線

はじめに数学オリンピックの問題を解くことができる人工知能を想像してみてください。これは単なる空想ではありません。Monte Carlo Tree Search Self-Improvement (MCTSr) アルゴリズムの登場により、この夢が現実になりつつあります。本記事では、この画期的なアルゴリズムが人工知能の世界にもたらす変革について深く掘り下げていきます。 MCTSrの本質：LLMとMCTSの革新的融合背景：LLMの限界に挑む大規模言語モデル（LLM）は、自然言

Yuya Fujiwa…

2週間前

2
Monte Carlo Tree Search Self-Improvement (MCTSr) Algorithm: 革新的な数学的推論の最前線

2

Yuya Fujiwara

2週間前

最近の記事

Prover-Verifier ゲームによる言語モデル出力の可読性向上

計算のある生命: 単純な相互作用から整形された自己複製プログラムが出現する仕組み

人間のような無限コンテキストLLMのためのエピソード記憶

STaR: 自己教師あり推論器（フルバージョン）

Prover-Verifier ゲームによる言語モデル出力の可読性向上

計算のある生命: 単純な相互作用から整形された自己複製プログラムが出現する仕組み

人間のような無限コンテキストLLMのためのエピソード記憶

STaR: 自己教師あり推論器（フルバージョン）

STaR: 自己教示型推論器 - 推論による推論のブートストラップ

STaR: 自己教示型推論器 - 推論による推論のブートストラップ

Monte Carlo Tree Search Self-Improvement (MCTSr) Algorithm: 革新的な数学的推論の最前線

Monte Carlo Tree Search Self-Improvement (MCTSr) Algorithm: 革新的な数学的推論の最前線