見出し画像

AIニュース 新着論文 2024.01.14


Theory of Mind abilities of Large Language Models in Human-Robot Interaction : An Illusion?

大規模言語モデルの心の理論能力は人間とロボットの相互作用において:幻想?

  • Mudit Verma , Siddhant Bhambri , Subbarao Kambhampati


  • 大規模言語モデル(LLM)は、人間のように言葉を使ってタスクをこなす能力が高いですが、これらのモデルが「心の理論」(他人の考えや信念を理解する能力)を持っているかどうかについて議論があります。研究者たちは、ロボットが人間とのやり取りでLLMを使って、人間がどのようにロボットの行動を理解するかを評価する実験を行いました。ロボットの行動が人間にとって説明しやすいか、予測しやすいかなどを調べるために、人間の参加者を使った調査を実施しました。結果はLLMが心の理論を持つ可能性を示唆していますが、完全には確認されていません。LLMが矛盾した情報や関係ない情報にも強いことが必要だとされています。この研究は、GPT-4とGPT-3.5-turboというモデルを使って行われました。

  • 公開:2024-01-10


ReACT: Reinforcement Learning for Controller Parametrization using B-Spline Geometries

ReACT:Bスプラインジオメトリを使用したコントローラーパラメータ化のための強化学習

  • Thomas Rudolf , Daniel Flögel , Tobias Schürmann , Simon Süß , Stefan Schwab , Sören Hohmann


  • この研究では、工場などの産業現場で使われる複雑な機械を効率的に制御するための新しい方法を提案しています。通常、機械を正確に動かすためには、多くの設定(パラメータ)を調整する必要がありますが、これは非常に難しく時間がかかります。そこで、研究者たちは人工知能(AI)の一種である深層強化学習(DRL)を使って、機械が自分で最適なパラメータを学習し、調整できるようにする技術を開発しました。この技術では、Bスプラインジオメトリ(BSG)という数学的な手法を使って、様々な動作条件に応じたパラメータの変化を効率的にマッピングします。また、長短記憶(LSTM)というニューラルネットワークを用いてデータを処理し、TQC(truncated quantile critic)アルゴリズムを改良して、実際の環境での性能を向上させています。この方法により、産業用の機械をより簡単に、そして高性能に制御できるようになります。

  • 公開:2024-01-10


Distributed Monitoring for Data Distribution Shifts in Edge-ML Fraud Detection

エッジML詐欺検出におけるデータ分布のシフトの分散監視

  • Nader Karayanni , Robert J. Shahla , Chieh-Lien Hsiao


  • エッジMLは、スマートフォンなどの端末で直接機械学習モデルを動かし、決済サービスでの不正行為をリアルタイムで検出する技術です。これにより、個々のユーザーに合わせたより迅速な不正検知が可能になります。ただし、問題は、端末ごとにデータが変わる(データ分布シフト)ことをどう監視するかでした。我々の研究では、この問題を解決するために、端末間でデータの変化を継続的にチェックする新しいオープンソースのシステムを開発しました。このシステムは、データの変化を効率的かつ正確に検出するための統計的手法(コルモゴロフ・スミルノフ検定)を利用しています。実際の金融取引データと模擬データの両方でテストし、このシステムが効果的であることを確認しました。

  • 公開:2024-01-10


Knowledge Sharing in Manufacturing using Large Language Models: User Evaluation and Model Benchmarking

製造業における大規模言語モデルを使用した知識共有:ユーザー評価とモデルのベンチマーキング

  • Samuel Kernan Freire , Chaofan Wang , Mina Foosherian , Stefan Wellsandt , Santiago Ruiz-Arenas , Evangelos Niforatos


  • この文章は、製造業の工場で働く人々が新しい情報を学び、問題を解決するのを助けるために、大規模な言語モデル(LLM)を使ったシステムについて説明しています。このシステムは、工場の文書にある知識を活用して、作業員が質問に対して迅速に答えを見つけられるようにするものです。実際の工場でのテストでは、このシステムが情報を早く見つけ出し、問題解決を効率的に行う助けになることが示されました。ただし、人々は可能なら専門家から直接学ぶ方を好むこともわかりました。また、GPT-4のような商用モデルとStableBeluga2のようなオープンソースモデルを比較し、GPT-4がわずかに優れているが、データのプライバシーやカスタマイズの面でオープンソースモデルも魅力的であることが分かりました。この研究は、工場が知識管理にLLMツールを使うことを考える際の初期のガイドとなります。

  • 公開:2024-01-10


Can ChatGPT Rival Neural Machine Translation? A Comparative Study

ChatGPTがニューラル機械翻訳と競合できるか?比較研究

  • Zhaokun Jiang , Ziyin Zhang


  • この研究では、ChatGPTという大規模な言語モデルを使って、中国の外交文書を英語に翻訳する能力を評価しています。ChatGPTの翻訳品質を、従来のニューラル機械翻訳エンジンと比較しました。翻訳の良さを測るために、自動的に計算されるスコアと、人間が行う評価の両方を使いました。研究結果によると、自動スコアではChatGPTと従来の翻訳エンジンが似たような結果を示しましたが、人間の評価者は、文脈情報が与えられたときにChatGPTの翻訳をより高く評価する傾向がありました。しかし、自動スコアと人間の評価の間には強い一致が見られなかったことから、翻訳品質を評価する二つの方法には差があることが示唆されました。この研究は、ChatGPTが翻訳ツールとしてどのように機能するか、そしてどのように改善できるかについての洞察を提供しています。

  • 公開:2024-01-10


Derm-T2IM: Harnessing Synthetic Skin Lesion Data via Stable Diffusion Models for Enhanced Skin Disease Classification using ViT and CNN

Derm-T2IM:ViTとCNNを使用した強化された皮膚疾患分類のための安定した拡散モデルを介した合成皮膚病変データの活用

  • Muhammad Ali Farooq , Wang Yao , Michael Schukat , Mark A Little , Peter Corcoran


  • この研究では、人工的に作られた皮膚の病変の画像(合成データ)を使って、機械学習モデルの学習を改善する方法を探っています。通常、機械学習モデルは多くのラベル付きデータ(正しい答えがついたデータ)が必要ですが、これが不足している場合があります。そこで、合成データを使ってデータの量と多様性を増やし、モデルが実際の皮膚病変をより正確に識別できるようにすることを目指しています。実験では、この方法が機械学習モデルの性能を向上させ、新しい実世界のデータに対してもうまく機能することを示しています。

  • 公開:2024-01-10


Neural Population Learning beyond Symmetric Zero-sum Games

対称的なゼロサムゲームを超えたニューラル集団学習

  • Siqi Liu , Luke Marris , Marc Lanctot , Georgios Piliouras , Joel Z. Leibo , Nicolas Heess


  • 我々の研究チームは、複数人が参加する複雑なゲームにおいて、プレイヤーがどのようにして公平な状態(均衡)に達するかを効率的に計算する方法を開発しました。従来の方法では計算が難しかったり、理論的な問題があったりしましたが、私たちは新しいアルゴリズムを使って、プレイヤーのスキルを他のゲームに移すことができるようにしました。このアルゴリズムは、OpenSpielというゲームプラットフォームでテストされ、良い結果が得られました。また、MuJoCoというシミュレーション環境でのチームワークや、capture-the-flagというゲームでのスキルの移行にも成功しました。この研究は、実際の世界で異なる目的を持つプレイヤーが参加するゲームにも応用できることを示しています。

  • 公開:2024-01-10



Any-Way Meta Learning

どのような方法でもメタラーニング

  • Junhoo Lee , Yearim Kim , Hyunho Lee , Nojun Kwak


  • AAAIは人工知能に関する専門的な組織で、研究論文などの学術資料を出版しています。彼らは著者から提供されたデジタル形式の原稿を使って、これらの資料を直接作成します。出版される資料が一貫した品質と形式を保つために、著者は特定のルールやフォーマットの指示に従う必要があります。これにより、すべての論文が読みやすく、専門的な標準に合致した状態で出版されることが保証されます。

  • 公開:2024-01-10


Generating Diverse and High-Quality Texts by Minimum Bayes Risk Decoding

最小ベイズリスクデコーディングによる多様で高品質なテキストの生成

  • Yuu Jinnai , Ukyo Honda , Tetsuro Morimura , Peinan Zhang


  • 文章生成システムでは、ただ正確な文章を作るだけでなく、様々な種類の文章を作れることが大切です。最近、MBRという方法が高品質な文章を作るのに良いとされていますが、多様性を出すための既存の方法は限界があります。この研究では、MBRに新しい工夫を加えて、多様な文章を作れるようにしたアルゴリズムを提案しています。この新しい方法は、従来の方法よりも多様な文章を作り出すことができると実験で示されています。具体的には、文章の質と多様性のバランスが良く、様々な文章生成タスクで有効であることがわかりました。

  • 公開:2024-01-10


CreINNs: Credal-Set Interval Neural Networks for Uncertainty Estimation in Classification Tasks

CreINNs:分類タスクにおける不確実性推定のための信用区間ニューラルネットワーク

  • Kaizheng Wang , Keivan Shariatmadar , Shireen Kudukkil Manchingal , Fabio Cuzzolin , David Moens , Hans Hallez


  • この研究では、新しいタイプのニューラルネットワーク(CreINN)が紹介されています。このネットワークは、コンピュータが画像やデータを分類する際の「不確実性」をより正確に評価することができます。不確実性推定は、コンピュータがどれだけ自信を持って判断しているかを理解するのに役立ちます。CreINNは、従来のニューラルネットワークよりも少ない計算で、より小さいサイズで動作し、特に新しいや未知のデータに対するコンピュータの判断がどれだけ信頼できるかをより良く評価できることが実験で示されました。これにより、コンピュータの判断がより信頼性があり、実用的な応用が期待されます。

  • 公開:2024-01-10


Autonomous Navigation of Tractor-Trailer Vehicles through Roundabout Intersections

トラクタートレーラー車両の自律航行による環状交差点を通過する方法

  • Daniel Attard , Josef Bajada


  • 自動運転技術は進化していますが、大型のトラックとトレーラーのような複雑な車両に特化した研究はまだ少ないです。これらの車両は、曲がるときにトレーラーの後輪がトラックよりも狭い範囲で曲がるため、特別な運転技術が必要です。この研究では、高度なシミュレーションソフトウェアを使って、トラックとトレーラーの運転を模倣するモデルを作り、それを基に自動運転の訓練を行いました。新しい自動運転アルゴリズムを使って、円形交差点(ラウンドアバウト)を含むさまざまな状況で73%の成功率を達成しました。これにより、大型車両の自動運転技術の発展に貢献しています。

  • 公開:2024-01-10


Invertible Solution of Neural Differential Equations for Analysis of Irregularly-Sampled Time Series

不規則にサンプリングされた時系列の解析のためのニューラル微分方程式の逆解析

  • YongKyung Oh , Dongyoung Lim , Sungil Kim


  • 我々は、不完全で不定期に記録されたデータの複雑さを扱う新しい手法を提案しています。この手法は、神経微分方程式(NDE)に基づいており、データの時間的な変化を分析するのに強力ですが、通常は過去の状態に戻ることが保証されていません。私たちのアプローチでは、計算の負担を増やさずに、データを元の状態に戻すことができるように改良しました。これにより、データの時間的な動きをより正確にモデル化し、分類やデータの欠損部分を補うタスクで優れた性能を発揮します。実験では、この手法が他のモデルよりも優れていることが証明されており、不規則な時系列データの分析を大きく進歩させる可能性があります。

  • 公開:2024-01-10


Closed-Form Interpretation of Neural Network Classifiers with Symbolic Regression Gradients

シンボリック回帰勾配を用いたニューラルネットワーク分類器の閉形式解釈

  • Sebastian Johann Wetzel


  • この文章は、ニューラルネットワーク(人工知能の一種)を使った科学的な発見を自動化するための新しい方法を紹介しています。ニューラルネットワークは通常、その内部の動作が複雑で理解しにくいですが、この研究では、ニューラルネットワークがどのように判断を下しているかを人間が理解しやすい形で表現する方法を開発しました。具体的には、ニューラルネットワークが分類(データをカテゴリに分けること)を行う際の判断基準を、人間が読める方程式として表現することで、ニューラルネットワークの動作を解釈可能にします。この方法は、分類だけでなく、ニューラルネットワークの他の部分や回帰(数値予測)にも適用でき、ニューラルネットワークの理解を深めるのに役立ちます。

  • 公開:2024-01-10


Information Flow Rate for Cross-Correlated Stochastic Processes

相互相関する確率過程の情報フロー率

  • Dionissios T. Hristopulos


  • 因果推論は、ある事象が別の事象を引き起こす関係を見つけ出す研究です。Liangが提案した方法は、時間の経過とともに変化するデータ(時系列データ)を使って、どのように情報が流れるかを測定することで、原因と結果の関係を探ります。この方法は、異なる要素間でどれだけ情報が移動しているかを示す「エントロピー移動率」という数値を使います。研究者たちは、実際のデータを使ってこの情報の流れを分析し、原因と結果の関係をよりよく理解するために、情報の流れがどのように期待値や相関関数(事象間の関連性を示す数値)と関連しているかを調べます。この分析は、データのサンプリング方法や事象間の関連の強さ、時間的なズレが情報の流れにどう影響するかを明らかにします。数値シミュレーションを通じて、この理論が実際に成り立つことが示されています。

  • 公開:2024-01-10


Fully Decentralized Cooperative Multi-Agent Reinforcement Learning: A Survey

完全に分散協力型のマルチエージェント強化学習:調査

  • Jiechuan Jiang , Kefan Su , Zongqing Lu


  • 協調的マルチエージェント強化学習は、複数のプログラム(エージェント)が協力して問題を解決する技術です。しかし、実際の使用では、これらのエージェントが互いに情報を共有せずに独立して学習する必要があることが多いです。これは、エージェントが他のエージェントについての情報が少ないため、最適な協力方法を見つけるのが難しいという課題を生み出します。この研究では、エージェントが共通の目標を達成するために報酬を最大化する方法と、各エージェントが個別に報酬を最大化する方法の両方を、情報共有をせずにどう実現するかを検討しています。また、この分野でまだ解決されていない問題や、将来の研究の方向性についても議論しています。効果としては、実世界の協力が必要なタスク(例えば、自動運転車の群れの協調)でのエージェントの性能向上が期待されます。

  • 公開:2024-01-10


The Impact of Reasoning Step Length on Large Language Models

大規模言語モデルにおける推論ステップの長さの影響

  • Mingyu Jin , Qinkai Yu , Dong shu , Haiyan Zhao , Wenyue Hua , Yanda Meng , Yongfeng Zhang , Mengnan Du


  • 思考の連鎖(CoT)は、人工知能が問題を解決する際の推論ステップを示す方法です。研究では、これらのステップの長さが人工知能の推論能力にどう影響するかを調べました。結果として、推論ステップを長くすると、新しい情報を加えなくても、人工知能はより良く問題を解決できることがわかりました。しかし、ステップを短くすると、重要な情報があっても推論能力が下がります。また、推論ステップが多いほど、複雑な問題に対して人工知能がより良い結果を出すことが分かりましたが、単純な問題では少ないステップでも十分です。驚くべきことに、推論ステップが正しいかどうかよりも、その長さが重要であることが示されました。この研究は、人工知能が複雑な問題を解決するのに役立つ指針を提供します。

  • 公開:2024-01-10


User Embedding Model for Personalized Language Prompting

個人向け言語プロンプティングのためのユーザー埋め込みモデル

  • Sumanth Doddapaneni , Krishna Sayana , Ambarish Jash , Sukhdeep Sodhi , Dima Kuzmin


  • この研究は、人々の好みを理解するために、長いユーザー履歴を効果的に扱う新しい技術について述べています。研究者たちは、ユーザーの過去の行動や好みを短い情報に圧縮し、これを言語モデル(コンピュータが言語を理解するためのプログラム)に組み込む方法を開発しました。この技術により、レコメンデーションシステム(ユーザーに商品や情報を提案するシステム)は、非常に長い履歴も扱えるようになり、より正確な提案が可能になります。実験では、この方法が従来の方法よりも優れており、予測の精度が大幅に向上することが示されました。具体的には、モデルの予測性能が最大0.21ポイント、0.25ポイント改善されました。この研究の重要な点は、ユーザーの情報を使って言語モデルの判断に影響を与えることができることを示したことです。

  • 公開:2024-01-10


An Optimizing Framework on MLIR for Efficient FPGA-based Accelerator Generation

MLIRを活用した効率的なFPGAベースのアクセラレータ生成のための最適化フレームワーク

  • Weichuang Zhang , Jieru Zhao , Guan Shen , Quan Chen , Chen Chen , Minyi Guo


  • コンピューターの性能を向上させるために、特定の計算作業を高速化する専用のチップ(FPGA)が使われています。しかし、これらのチップをプログラムするのは難しいです。POMという新しいシステムは、このプログラミングを簡単にし、より効率的にするために開発されました。POMは複数のレベルでプログラムを最適化し、高度な技術を使って計算の流れを改善します。また、プログラマーが使いやすいツールを提供し、最適な設計を自動的に見つけ出す機能も備えています。実験では、POMを使うことで計算速度が平均6倍以上になることが示されました。これにより、限られたリソースでより多くの計算を行うことが可能になります。

  • 公開:2024-01-10


Leveraging Print Debugging to Improve Code Generation in Large Language Models

大規模言語モデルにおけるコード生成の改善に向けたプリントデバッグの活用

  • Xueyu Hu , Kun Kuang , Jiankai Sun , Hongxia Yang , Fei Wu


  • 大規模言語モデル(LLM)は、プログラムを自動で作成する技術で、特にコードを生成する分野で大きな進歩を達成しています。しかし、複雑なデータやアルゴリズムを使うプログラミングの問題を解決する能力にはまだ改善の余地があります。この問題に対応するため、研究者たちは「プリントデバッグ」という手法を使って、LLMがプログラムの誤りを見つけて修正するのを助ける新しい学習方法を提案しました。この方法を評価するために、プログラミングの問題を集めたLeetcodeというデータセットを使い、オンラインでプログラムが正しく動くかを判定するシステムを通じてテストしました。GPT-4という最新のモデルを使った実験では、この新しい方法が効果的であることが示され、特に中レベルの問題を解決する能力が従来のデバッグ方法よりも17.9%向上しました。

  • 公開:2024-01-10


Language-based Valence and Arousal Expressions between the United States and China: a Cross-Cultural Examination

言語に基づくアメリカと中国の間の感情と興奮の表現:異文化間の検証

  • Young-Min Cho , Dandan Pang , Stuti Thapa , Garrick Sherman , Lyle Ungar , Louis Tay , Sharath Chandra Guntuku


  • この研究は、アメリカのツイッターと中国の新浪微博(Sina Weibo)での人々の感情表現の違いを調べています。感情は「価(ポジティブかネガティブか)」と「喚起(感情の強さ)」の2つの側面で分析されました。研究では、アメリカ人と中国人の間で感情の表現に違いがあることがわかりました。ツイッターでは、感情の強さの変化が微博よりもはっきりしていないが、感情が高まるときの反応はより強いことが観察されました。また、ツイッターでは個人的な話題が多く、微博では社会政治的な話題が多いことが分かりました。この研究は、ソーシャルメディアでの感情表現が文化によって異なることを示し、感情表現の研究に新たな視点を提供しています。

  • 公開:2024-01-10

この記事が気に入ったらサポートをしてみませんか?