見出し画像

自動論文まとめ4月22日

大規模言語モデルを用いた合成表形式データ生成のためのグループ別プロンプティング [LLM]

Group-wise Prompting for Synthetic Tabular Data Generation using Large Language Models

著作者: Jinhee Kim, Taesung Kim, Jaegul Choo

Trend

機械学習における合成表形式データ生成の課題を解決するため、大規模言語モデルを用いた新しい方法が提案されている。

Contribution

大規模言語モデルを用いたグループ別プロンプティング方法を導入し、データの不均衡問題に対処することができる。さらに、ランダムワード置換戦略を提案し、カテゴリ値の単調性を改善し、合成データの精度と表現力を向上させることができる。

コンテキストの摂動による科学QAにおけるLLMの棄権行動の特性化 [LLM]

Characterizing LLM Abstention Behavior in Science QA with Context Perturbations

著作者: Bingbing Wen, Bill Howe, Lucy Lu Wang

Trend

この研究では、科学の質問に対するLLMの棄権行動を研究している。

Contribution

LLMが不適切な文脈や追加文脈が与えられた場合にどのように回答を棄権するかを調査し、QAタスクの正確性に与える影響を明らかにしている。

大規模言語モデルの文化的適応性を測定するためのベンチマーク:NORMAD [LLM]

NORMAD: A Benchmark for Measuring the Cultural Adaptability of Large Language Models

著作者: Abhinav Rao, Akhila Yerukola, ..., Maarten Sap

Trend

大規模言語モデル(LLMs)の異なる文化への適応性を測定するための新たなベンチマークが必要とされていた。

Contribution

本研究では、NormAdという新しいデータセットを導入し、LLMsの文化的適応性を評価した。結果は、LLMsが文化的な推論に苦しんでおり、英語中心の文化には適応性が高いが、グローバルサウスの文化には適応性が低いことを示している。

大規模言語モデルのための信頼性の高いベイジアン推論フレームワークBIRD [LLM]

BIRD: A Trustworthy Bayesian Inference Framework for Large Language Models

著作者: Yu Feng, Ben Zhou, ..., Dan Roth

Trend

大規模言語モデルは、不完全な文脈や条件が多い現実世界のタスクに適用する際に信頼性の低い意思決定を行うことがある。

Contribution

本論文では、大規模言語モデルのための信頼性の高いベイジアン推論フレームワークであるBIRDを提案し、人間の判断と一致する確率推定を行うことができることを示した。

Leanにおける定理証明のための大規模言語モデルをコパイロットとして向かって [LLM]

Towards Large Language Models as Copilots for Theorem Proving in Lean

著作者: Peiyang Song, Kaiyu Yang, Anima Anandkumar

Trend

大規模言語モデル(LLMs)を用いた定理証明は重要な課題であり、既存の自律型証明器は人間の介入なしに定理を証明しようとするが、新しい難しい定理には苦労している。

Contribution

本論文では、LLMsを人間の証明支援として活用するLean Copilotフレームワークを紹介し、Leanユーザーのワークフローにシームレスに統合できる様々なLLMベースの証明自動化ツールを構築する方法を提案。実験結果は、既存のルールベースの証明自動化と比較して、本手法が人間を支援し、定理証明プロセスを自動化する効果を示している。

拡散ベースのポリシー学習における状態的振る舞いの実現 [Diffusion Models]

Enabling Stateful Behaviors for Diffusion-based Policy Learning

著作者: Xiao Liu, Fabian Weigend, ..., Heni Ben Amor

Trend

ロボットの実行中に一貫したアクションを獲得することが難しいという課題に対処するため、既存のアプローチはアクション表現の変更やモデルの変更に焦点を当ててきた。

Contribution

本研究では、Diff-Controlポリシーを導入し、拡散ベースのモデルを使用してアクション表現を学習することで、アクションの一貫性を向上させる方法を提案している。この方法により、アクションの状態性を組み込むことで、ロバスト性と成功率が向上することを示している。

この記事が気に入ったらサポートをしてみませんか?