見出し画像

AI ニュース 論文新着情報 2024.01.10


ChatGPT for Conversational Recommendation: Refining Recommendations by Reprompting with Feedback

Conversational RecommendationのChatGPT:フィードバックをもとに再プロンプトして推薦を洗練化

  • Kyle Dylan Spurlock , Cagla Acun , Esin Saka , Olfa Nasraoui


  • レコメンデーション・アルゴリズムは、インターネット上の多くの情報からユーザーに合ったコンテンツを推薦するために使われますが、これまでのシステムはユーザーの意見をあまり取り入れていませんでした。最近のChatGPTのような進化したシステムは、ユーザーのフィードバックに基づいて推薦を改善することができます。この研究では、ChatGPTを使ってユーザーがどのように推薦を求めるかを模倣し、その結果を他のシステムと比較しました。結果として、ユーザーからのフィードバックを取り入れることで推薦の質が向上し、また、人気のあるコンテンツに偏る傾向(人気バイアス)も適切な質問(プロンプトエンジニアリング)によって減らすことができることがわかりました。

  • 公開:2024-01-07


Disentangled Neural Relational Inference for Interpretable Motion Prediction

解釈可能な動き予測のための分離されたニューラル関係推論

  • Victoria M. Dax , Jiachen Li , Enna Sachdeva , Nakul Agarwal , Mykel J. Kochenderfer


  • この研究は、自律ロボットが他の動く物体やロボットと上手にやり取りするための技術についてです。従来の方法では、ロボットがこれらの動的な環境を予測する能力を高めることに焦点を当てていましたが、予測がどのように行われているかを理解しやすくする(解釈可能性)と、見たことのない新しい状況にも対応できるようにする(分布外汎化)ことにはあまり注目されていませんでした。この研究では、グラフ(物体やロボット間の関係を表す図)と時系列データ(時間とともに変化するデータ)を組み合わせた新しい方法を使って、これらの問題に取り組んでいます。この方法では、ロボットが互いにどのように影響し合うかをよりよく理解し、未知の状況でもうまく動けるようになることを目指しています。実際のデータとシミュレーションデータの両方でテストを行い、この新しい方法が従来の方法よりも優れていることを示しています。

  • 公開:2024-01-07


Evaluating and Personalizing User-Perceived Quality of Text-to-Speech Voices for Delivering Mindfulness Meditation with Different Physical Embodiments

ユーザーが認識するテキスト読み上げ音声の品質を評価し、マインドフルネス瞑想を異なる身体的具現化で提供するための個人化を行う

  • Zhonghao Shi , Han Chen , Anna-Maria Velentza , Siqi Liu , Nathaniel Dennler , Allison O'Connell , Maja Matarić


  • マインドフルネス療法は心の健康を良くするのに役立ちますが、この療法をもっと手軽に受けられるようにするために、テクノロジーが使われています。特に、個人の好みに合わせたマインドフルネスの指導をリアルタイムで提供するために、人工的な音声(テキスト・トゥ・スピーチ、TTS)が必要です。研究では、異なるタイプのTTS音声と実際の人間のセラピストの音声を比較しました。結果、人間の音声が最も好まれましたが、ユーザーがTTS音声を自分で調整できるようにすると、その音声の質が大幅に向上し、人間の音声に近いレベルになることがわかりました。これは、マインドフルネス療法をもっとアクセスしやすくするために、TTS音声のカスタマイズが非常に有効であることを示しています。

  • 公開:2024-01-07


Agent AI: Surveying the Horizons of Multimodal Interaction

エージェントAI:マルチモーダルインタラクションの地平を調査する

  • Zane Durante , Qiuyuan Huang , Naoki Wake , Ran Gong , Jae Sung Park , Bidipta Sarkar , Rohan Taori , Yusuke Noda , Demetri Terzopoulos , Yejin Choi , Katsushi Ikeuchi , Hoi Vo , Li Fei-Fei , Jianfeng Gao


  • マルチモーダルAIシステムは、視覚や言語など複数の情報を理解できる人工知能です。これらのAIは、私たちの周りの物理的または仮想の環境に「エージェント」として存在し、より自然に私たちと対話します。エージェントは、人の行動や感情、環境の物体、音声などの情報を組み合わせて理解し、適切に反応することができます。これにより、AIはより実用的で、人間のようなやり取りが可能になります。研究者は、AIが環境に合わせて行動を改善する方法を探求しており、これによりAIの誤解や不適切な反応を減らすことができます。将来的には、私たちはバーチャルリアリティやシミュレーションの中で、リアルなAIエージェントと簡単にやり取りできるようになるでしょう。

  • 公開:2024-01-07


Privacy-Preserving in Blockchain-based Federated Learning Systems

ブロックチェーンベースのフェデレーテッドラーニングシステムにおけるプライバシー保護

  • Sameera K. M. , Serena Nicolazzo , Marco Arazzi , Antonino Nocera , Rafidha Rehiman K. A. , Vinod P , Mauro Conti


  • 連合学習(FL)は、データを共有せずに複数の参加者が共同で機械学習モデルを学習する新しい方法です。しかし、この方法はセキュリティやプライバシーの問題を引き起こす可能性があります。そこで、ブロックチェーン技術を組み合わせることで、これらの問題を解決しようとする研究が進められています。この論文は、ブロックチェーンを使ったFLのプライバシー保護に関する研究を調査し、どのような技術や理論があるか、どんな課題が残っているかをまとめています。また、この技術がどのように応用されているかの例も紹介しています。この研究は、ブロックチェーンとFLの組み合わせによる進歩を理解し、改善のための道を開くのに役立つと考えられています。

  • 公開:2024-01-07


NovelGym: A Flexible Ecosystem for Hybrid Planning and Learning Agents Designed for Open Worlds

NovelGym: オープンワールド向けに設計された柔軟なハイブリッド計画と学習エージェントのためのエコシステム

  • Shivam Goel , Yichen Wei , Panagiotis Lymperopoulos , Matthias Scheutz , Jivko Sinapov


  • AIエージェントが実際の世界で活躍するためには、予測できない状況にも対応できる必要があります。このため、研究者たちは「NovelGym」というシステムを開発しました。これは、AIが実世界のような複雑で変化する環境で学習し、試されるための仮想的な場所です。自動運転車や配送ロボット、調理ロボットなどが実際に使われる前に、このNovelGymで様々な状況に対応できるかテストすることができます。このシステムは柔軟で変更が容易なため、研究者はさまざまなシナリオを作り出してAIの能力を広範囲にわたって評価することができます。効果としては、AIが実世界の予測不可能な状況にもうまく対応できるようになることが期待されます。

  • 公開:2024-01-07


Is there really a Citation Age Bias in NLP?

NLP(自然言語処理)において本当に引用年齢の偏りがあるのでしょうか?

  • Hoa Nguyen , Steffen Eger


  • 科学論文では、他の研究を引用することが一般的ですが、最近、特に人工知能(AI)の分野で、新しい研究ばかりが引用され、古い研究が忘れられがちになっているという問題が指摘されています。これを「引用健忘症」と呼びます。研究者たちは、2013年から2022年にかけて、科学論文のデータベースであるArxivに投稿された約30万件の論文を分析しました。その結果、AI関連の分野では、過去10年間で引用される論文の平均年齢が約半分に減少していることがわかりました。つまり、2013年には平均12歳以上だった論文が、2022年には7歳以下になっています。これは、AI分野で新しい知識が非常に速いペースで生み出されているためと考えられています。

  • 公開:2024-01-07


Token-free LLMs Can Generate Chinese Classical Poetry with More Accurate Format

トークンフリーLLMは、より正確な形式で中国の古典詩を生成することができます。

  • Chengyue Yu , Lei Zang , Jiaotuan Wang , Chenyi Zhuang , Jinjie Gu


  • この論文では、ChatGPTのような大規模な言語モデルが、人間の指示に従って中国の古典詩を作る能力について説明しています。しかし、これらのモデルは内容は良いものの、詩の形式、特に各行の文字数を正確にするのが苦手です。これは、モデルが「トークン」という単位で情報を処理するため、形式を正確にするのが難しいからです。研究者たちは、モデルがトークンと文字の関係をあまり理解していないことを発見しました。そこで、彼らはモデルを調整して、文字レベルで情報を処理するようにしました。この新しい「トークンフリー」モデルは、詩の形式をより正確に生成でき、テストでは0.96の高い精度を達成しました。これは従来のトークンベースのモデルやGPT-4よりも優れています。

  • 公開:2024-01-07


Computational Argumentation-based Chatbots: a Survey

計算論に基づく議論型チャットボット:調査

  • Federico Castagna , Nadin Kokciyan , Isabel Sassoon , Simon Parsons , Elizabeth Sklar


  • チャットボットは、人と会話するように作られたコンピュータープログラムです。最近、チャットボットは「計算論証」という技術と組み合わされて、人間のように情報をやり取りする方法をよりよく理解し、形式化するようになりました。これにより、チャットボットは議論や討論をする能力を持つようになり、人間との対話がより自然で有意義になります。研究レビューでは、この新しいタイプのチャットボットがどのような利点と欠点を持つかを検討し、将来的にはさらに進化した言語モデルと組み合わせることで、より賢く会話できるチャットボットが開発される可能性があることを示唆しています。

  • 公開:2024-01-07


Exploring Large Language Model based Intelligent Agents: Definitions, Methods, and Prospects

大規模言語モデルに基づく知的エージェントの探索:定義、方法、展望

  • Yuheng Cheng , Ceyao Zhang , Zhengwen Zhang , Xiangrui Meng , Sirui Hong , Wenhao Li , Zihao Wang , Zekai Wang , Feng Yin , Junhua Zhao , Xiuqiang He


  • インテリジェント・エージェントは、人間のように思考し行動できるコンピュータープログラムです。これらは人工知能の一種で、将来的には人間の知能に匹敵する「汎用人工知能」への一歩と見なされています。研究者たちは、これらのエージェントを様々な方法で作成し、改善するために努力しています。特に、大規模言語モデル(LLM)を使ったエージェントは、自然言語を使って人間とコミュニケーションを取り、多くの異なるタスクに適応する能力があります。この論文では、LLMをベースにしたエージェントの基本的な要素、研究方法、彼らがどのように環境から学び反応するか、そして複数のエージェントがどのように協力して問題を解決するかについて詳しく説明しています。また、これらのエージェントがどのように実際のアプリケーションで使われているか、そして将来の展望についても考察しています。

  • 公開:2024-01-07


On Leveraging Large Language Models for Enhancing Entity Resolution

大規模言語モデルを活用してエンティティ解決を強化するために

  • Huahang Li , Longyu Feng , Shuangyin Li , Fei Hao , Chen Jason Zhang , Yuanfeng Song , Lei Chen


  • エンティティ解決とは、異なる情報源からのデータを比較し、同じ実際の対象(人や物など)に関する情報を見つけ出して統合する作業です。これは、オンラインショッピング、医療、警察の仕事など多くの分野でとても大切です。GPT-4のような大きな言語モデルは、この作業に役立つ高度な言語処理能力を持っています。この研究では、言語モデルを使ってエンティティ解決を行う際のメリットと、それに伴う計算の難しさについて考察します。また、限られた資源の中で最も効果的な質問を選ぶ方法や、言語モデルからの回答をもとに情報を整理する新しい手法を提案し、その有効性を実験で示しています。

  • 公開:2024-01-07


Escalation Risks from Language Models in Military and Diplomatic Decision-Making

軍事および外交政策決定における言語モデルからのエスカレーションリスク

  • Juan-Pablo Rivera , Gabriel Mukobi , Anka Reuel , Max Lamparth , Chandler Smith , Jacquelyn Schneider


  • 政府は、軍事や外交の決定を助けるために、自律型AIエージェント(自分で考えて行動できる人工知能)の使用を考えています。特に、GPT-4のような進んだAIが注目されています。これらのAIを使って、戦争ゲームのシミュレーションを行い、国と国との間の紛争が悪化する「エスカレーション」という行動を研究しています。研究では、AIが紛争を悪化させる傾向があるかどうか、そしてそのパターンを予測するのが難しいかを調べています。時には、AIが核兵器を使うような危険な行動を選ぶこともあります。これらの行動は、抑止力や先制攻撃といった戦術に基づいて正当化されることがあり、これは懸念されるべき点です。このような高いリスクを考慮して、AIエージェントを実際の軍事や外交に使う前に、さらに慎重な検討が必要だと研究は示唆しています。

  • 公開:2024-01-07


Predicting the Skies: A Novel Model for Flight-Level Passenger Traffic Forecasting

空を予測する:フライトレベルの乗客トラフィック予測のための新しいモデルについての小説

  • Sian Ehsani , Elina Sergeeva , Wendy Murdy , Benjamin Fox


  • この研究では、航空会社が飛行機の乗客数をより正確に予測できる新しい方法を開発しました。この予測は、チケットの価格設定や飛行ルートの計画など、航空会社の運営にとって非常に重要です。研究者たちは、アメリカン航空の広範なデータを使い、過去の乗客数、運賃情報、季節の変動などを分析する複雑なコンピューターモデルを作りました。このモデルは、時間の流れや関連する情報を考慮して、乗客数を予測します。結果として、従来の方法よりも33%精度が向上しました。これは、データを正確に処理し、深層学習技術を使うことが、乗客数予測を改善する大きな可能性を持っていることを示しています。

  • 公開:2024-01-07


An Investigation of Large Language Models for Real-World Hate Speech Detection

実世界のヘイト検出のための大規模言語モデルの調査

  • Keyan Guo , Alexander Hu , Jaden Mu , Ziheng Shi , Ziming Zhao , Nishant Vishwamitra , Hongxin Hu


  • ヘイトスピーチは、人々を攻撃する差別的な言葉で、オンラインでの問題です。今までの方法では、ヘイトスピーチを正確に見つけるのが難しいでした。しかし、大規模言語モデル(LLM)という新しい技術が、文脈を理解してヘイトスピーチを見つけるのに役立つことがわかりました。この研究では、LLMを使ってヘイトスピーチを検出する新しい方法を開発しました。この方法は、ヘイトスピーチの文脈をより良く捉え、以前の技術よりも優れていることが示されました。効果的にヘイトスピーチを検出するには、LLMに正しい質問をする「プロンプト戦略」が重要です。

  • 公開:2024-01-07


Gate--Level Statistical Timing Analysis: Exact Solutions, Approximations and Algorithms

ゲートレベルの統計的タイミング解析:正確な解、近似、およびアルゴリズム

  • Dmytro Mishagli , Eugene Koskin , Elena Blokhina


  • この論文は、コンピュータチップ内の論理ゲート(情報処理の基本単位)がデータを処理するのにかかる時間を予測する新しい方法について述べています。この予測は「統計的静的タイミング解析」と呼ばれ、チップの設計時に重要です。著者たちは、ゲートの遅延時間がどのように変動するかを数学的にモデル化し、その結果を正確に計算する方法を開発しました。この方法は、特に通常の計算より複雑な(非ガウス分布の)ケースに対応しています。また、チップ内で最も遅い経路(クリティカルパス)の遅延を見つけるためのアルゴリズムも提案しています。最終的に、このアプローチが実際に機能するかをテストし、従来のモンテカルロシミュレーションと比較しています。効果としては、チップ設計者がより正確にタイミングを予測し、信頼性の高いチップを設計できるようになることです。

  • 公開:2024-01-07


ROIC-DM: Robust Text Inference and Classification via Diffusion Model

ROIC-DM:拡散モデルを使用した堅牢なテキスト推論と分類

  • Shilong Yuan , Wei Yuan , Tieke HE


  • この文章は、テキストを理解したり分類したりするコンピュータープログラム(言語モデル)が、攻撃によって誤った結果を出すことがあると説明しています。これまでの研究では、プログラムを守るための「防御パッチ」という方法が使われていましたが、これには現実離れした前提が必要だったり、プログラムの性能が落ちたりする問題がありました。この文章で紹介されているのは、ROIC-DMという新しいモデルで、これはノイズ(不要な情報)を取り除く学習過程を通じて、攻撃に強い堅牢性を持つように作られています。ROIC-DMは、攻撃に対しても従来のモデルと同等かそれ以上の性能を発揮することができるとされています。

  • 公開:2024-01-07


LLMs for Robotic Object Disambiguation

ロボットの物体の曖昧さ解消のためのLLMs

  • Connie Jiang , Yiqing Xu , David Hsu


  • この研究では、大規模な言語モデル(LLM)がロボット工学の意思決定問題に役立つかどうかを調べています。特に、ロボットが多くの似たような物体の中から正しいものを選び出すという課題に焦点を当てています。従来、このような問題は部分的にしか情報が得られない状況(POMDP)でモデル化されていました。研究では、LLMが物体を区別する際の曖昧さを解消する能力を高めるために、プロンプトエンジニアリングという技術を使いました。これにより、LLMは与えられた情報を基に、必要な追加情報を推論し、正しい物体を選ぶための決定木を作成することができるようになりました。効果としては、ロボットが正確に目的の物体を識別し取り出すことが可能になり、より効率的な意思決定が行えるようになったことです。

  • 公開:2024-01-07


Detecting Anomalies in Blockchain Transactions using Machine Learning Classifiers and Explainability Analysis

ブロックチェーン取引の異常を検出するための機械学習分類器と説明可能な分析

  • Mohammad Hasan , Mohammad Shahriar Rahman , Helge Janicke , Iqbal H. Sarker


  • ブロックチェーン技術を使ったデジタル決済が増えると、不正な取引を見つけるのが難しくなります。この研究では、ビットコインの取引で異常を見つける新しい方法を提案しています。この方法は、取引データの中から異常を検出し、どの情報が異常かを説明する技術(XAI)を使っています。また、不正取引が少ない中でバランスを取るための特別なサンプリング技術(XGBCLUS)を開発しました。この技術は、異常な取引と正常な取引のデータのバランスを取り、より正確に不正を見つけることができます。実験では、この方法が他の一般的な方法よりも優れていることが示されています。効果としては、不正取引の検出率が向上し、デジタル決済の安全性が高まることが期待されます。

  • 公開:2024-01-07


Ensemble Defense System: A Hybrid IDS Approach for Effective Cyber Threat Detection

アンサンブルディフェンスシステム:効果的なサイバー脅威検知のためのハイブリッドIDSアプローチ

  • Sarah Alharbi , Arshiya Khan


  • 提案されている「アンサンブル防御システム(EDS)」は、複雑なサイバー攻撃から組織を守るためのセキュリティシステムです。このシステムは、異なる種類のセキュリティツールを組み合わせており、攻撃を検知して警告する役割を果たします。EDSは二つの主要な検知方法を使用しています:一つは既知の攻撃パターン(シグネチャ)に基づいて検知する方法、もう一つは通常とは異なる行動(アノマリー)を検知する方法です。さらに、EDSはElasticsearchというオープンソースのツールを利用して、セキュリティの警告を分析し、視覚的に表示することができます。EDSの効果は、様々な攻撃シナリオを使ってテストされ、多くの異なるタイプの攻撃を検出できることが実証されています。これにより、組織はより洗練されたサイバー攻撃に対しても効果的に対処できるようになります。

  • 公開:2024-01-07


Involution Fused ConvNet for Classifying Eye-Tracking Patterns of Children with Autism Spectrum Disorder

自閉症スペクトラム障害を持つ子供の視線追跡パターンを分類するためのInvolution Fused ConvNet

  • Md. Farhadul Islam , Meem Arafat Manab , Joyanta Jyoti Mondal , Sarah Zabeen , Fardin Bin Rahman , Md. Zahidul Hasan , Farig Sadeque , Jannatun Noor


  • 自閉症スペクトラム(ASD)は、脳の発達に関わる病気で、診断が難しいです。自閉症の子供たちは、注意を集中するのが苦手で、目の焦点が合わないことが多いです。目の動きを追跡する技術が、自閉症の診断に役立つと考えられています。この研究では、目の動きを追跡するセンサーとディープラーニング(DL)というコンピューター技術を組み合わせて、自閉症の診断を改善する方法を提案しています。ディープラーニングは、目の動きの複雑なパターンを学習して、正確に認識することができます。さらに、インボリューションという新しい技術を使うことで、目の動きのパターンをより効率的に分類できるようになります。この方法はシンプルで効果的で、実際の環境で使いやすいです。研究では、異なるデータセットを使って実験し、この新しいモデルが他の方法よりも優れていることを示しています。

  • 公開:2024-01-07


Text-Driven Traffic Anomaly Detection with Temporal High-Frequency Modeling in Driving Videos

ドライビングビデオでの時間的高周波モデリングを用いたテキスト駆動の交通異常検知

  • Rongqin Liang , Yuanman Li , Jiantao Zhou , Xia Li


  • 運転中の映像から交通の異常を検出する技術は、自動運転車や運転支援システムの安全性を高めるために重要です。これまでの方法は、カメラの動きによる背景の変化に弱く、誤検出や見逃しの原因になっていました。この論文では、TTHFという新しい方法を紹介しています。TTHFは、ビデオとテキストの情報を組み合わせて交通の異常を検出するもので、言語を使ってより詳細な情報を捉えることができます。また、運転映像の細かい変化を時間的に分析することで、異常を正確に検出する能力を向上させています。さらに、異常に集中するメカニズムを導入し、モデルが重要な視覚情報に焦点を当てやすくしています。この方法は、実際のデータセットでテストされ、他の最新技術よりも5.4%高い精度で異常を検出することができました。

  • 公開:2024-01-07


conv_einsum: A Framework for Representation and Fast Evaluation of Multilinear Operations in Convolutional Tensorial Neural Networks

conv_einsum:畳み込みテンソルニューラルネットワークにおける多線形演算の表現と高速評価のためのフレームワーク

  • Tahseen Rabbani , Jiahao Su , Xiaoyu Liu , David Chan , Geoffrey Sangston , Furong Huang


  • 最新の画像認識ネットワークは、多くのタスクで優れた成果を上げていますが、それには多くの計算量が必要です。これらのネットワークは、重みと呼ばれるパラメータを多数持っており、これらを効率的に扱うためには、特定の数学的手法(テンソル分解)を使って、重要な要素に分ける必要があります。この研究では、畳み込み層(画像認識において重要な部分)を効率的に計算する新しい方法を提案しています。この方法は、計算に必要な操作の数を減らすことで、学習速度を向上させることができます。実験により、この新しいアプローチが計算効率とメモリ使用量の両方を改善することが示されました。

  • 公開:2024-01-07


Towards Effective Multiple-in-One Image Restoration: A Sequential and Prompt Learning Strategy

効果的な複数画像の一斉修復に向けて:連続的かつ迅速な学習戦略

  • Xiangtao Kong , Chao Dong , Lei Zhang


  • 画像復元(IR)は、損傷や劣化した画像を修復する技術です。単一のタスクに特化したIRは成功していますが、複数の異なるIRタスクをこなせるモデルを作ることは難しいです。この研究では、7種類のIRタスクを同時に解決できる「Multiple-in-one(MiO)」という問題に取り組んでいます。研究者たちは、多様なタスクを効率的に学習し、それぞれに適応するための2つの方法を提案しています。一つ目は「逐次学習」で、タスクを一つずつ順番に学習することで、異なる目的を達成します。二つ目は「即応学習」で、モデルが各タスクに迅速に適応し、汎用性を高めることを目指します。これらの方法を19のテストセットで試した結果、CNNとTransformerという一般的な技術を使ったMiOモデルの性能が大きく向上することが示されました。また、これらの戦略が相互に補完し合い、モデルがより良い劣化表現を学び、頑健になることもわかりました。この研究は、多様なIRタスクに対応できるより汎用的なモデルを開発するための方法を提案しています。

  • 公開:2024-01-07


In-Database Data Imputation

データベース内のデータ補完

  • Massimo Perini , Milos Nikolic


  • 欠損データは情報が不完全なデータのことで、分析や意思決定に問題を引き起こします。従来の対処法は計算が速いものの、分析結果が不正確になることがあります。本研究では、MICEという方法を改良して、データベース内で欠損データを効率的に補完する技術を開発しました。この技術は計算を速くし、データの関係性を保ちながら、大規模なデータセットにも適用可能です。実験では、この方法が従来の技術よりも計算時間を大幅に短縮しつつ、高い品質を維持することを示しました。

  • 公開:2024-01-07

この記事が参加している募集

仕事について話そう

この記事が気に入ったらサポートをしてみませんか?