見出し画像

AI ニュース 新着論文 2024.01.11


Can Large Language Models Beat Wall Street? Unveiling the Potential of AI in Stock Selection

大規模言語モデルはウォール街を打ち負かすことができるか?AIの株式選択における潜在能力の公開

  • Georgios Fatouros , Konstantinos Metaxas , John Soldatos , Dimosthenis Kyriazis


  • この論文は、金融市場で株を選ぶための新しいAIシステム「MarketSenseAI」を紹介しています。このシステムは、GPT-4という高度なAIを使って、市場の動き、ニュース、企業の基本情報、経済レポートなど様々な情報を分析します。それをもとに、投資家が株を買うか、持ち続けるか、売るかを決めるのを助ける「投資シグナル」を出します。このAIは、ただシグナルを出すだけでなく、なぜそのシグナルを出したのかを説明することで、投資家がそのアドバイスを信じやすくしています。実際にS&P100の株でテストした結果、MarketSenseAIは市場平均よりも13%良い成績を出し、最大で40%の利益を上げました。これはAIが金融分析と投資戦略に革命をもたらす可能性があることを示しています。

  • 公開:2024-01-08


A Large-scale Empirical Study on Improving the Fairness of Deep Learning Models

深層学習モデルの公平性向上に関する大規模な実証研究

  • Junjie Yang , Jiajun Jiang , Zeyu Sun , Junjie Chen


  • 深層学習モデルが公平であることは、それを使う全ての人にとって公正な結果をもたらすために重要です。しかし、どの方法が最も公平な結果を生むかを比較する研究はまだ十分ではありません。この研究では、画像分類という一般的なタスクにおいて、13の異なる公平性向上手法を3つのデータセットと5つの評価指標を使って比較しました。結果は、手法によって性能に大きな違いがあり、特定の状況に特化していることがわかりました。また、評価指標によっても結果が異なることが示されました。この研究は、深層学習モデルの公平性を高めるための包括的なアプローチを提供し、研究者がより効果的な解決策を見つけるための統一された評価プラットフォームを提案しています。

  • 公開:2024-01-08


MoE-Mamba: Efficient Selective State Space Models with Mixture of Experts

MoE-Mamba: ミクスチャーオブエキスパートを用いた効率的な選択的状態空間モデル

  • Maciej Pióro , Kamil Ciebiera , Krystian Król , Jan Ludziejewski , Sebastian Jaszczur


  • MAMBAとは、ある種の技術やシステムのことを指しており、そこに「ミックス・オブ・エキスパート」という手法を組み合わせることで、その効率を何倍にも向上させています。「ミックス・オブ・エキスパート」とは、複数の専門家(または専門的な部品やプログラム)を組み合わせて、それぞれの強みを活かすことで全体の性能を高めるアプローチです。この結果、MAMBAの機能が大幅に改善され、以前よりもはるかに効率的になっています。具体的な効果としては、タスクをより速く、正確に、または低コストで実行できるようになることが挙げられます。

  • 公開:2024-01-08


Simultaneous Task Allocation and Planning for Multi-Robots under Hierarchical Temporal Logic Specifications

多階層時間論理仕様の下での複数ロボットの同時タスク割り当てと計画

  • Xusheng Luo , Changliu Liu


  • この文章は、ロボットが複雑なタスクを効率的に計画するための新しい方法について説明しています。従来の方法では、ロボットの行動を指示するルール(LTL式)が複雑なタスクで長くなりすぎて、計画が難しくなっていました。この研究では、タスクの構造を利用してLTL式を階層化し、ロボットがルールをより簡単に理解できるようにしました。また、複数のロボットが協力してタスクをこなす際に、効率的な計画を立てる新しい探索方法を開発しました。この方法では、探索空間を小さな部分に分けて、ロボットがその中で最適な行動を見つけやすくしています。さらに、計画の速度を上げるための工夫も加えられています。この新しい方法は、実験で30台のロボットを使ってテストされ、従来の方法よりも速く同じ品質の計画を立てられることが示されました。

  • 公開:2024-01-08


Behavioural Cloning in VizDoom

VizDoomにおける行動クローニング

  • Ryan Spick , Timothy Bradley , Ayush Raina , Pierluigi Vito Amadori , Guy Moss


  • この論文は、コンピュータゲーム「Doom 2」をプレイする人工知能(AI)エージェントを訓練する新しい方法について説明しています。この方法では、ゲームの画像(ピクセルデータ)だけを使って、AIが人間のプレイヤーの行動を真似るように学習します。研究者たちは、AIが攻撃的、受動的など、異なるプレイスタイルを持つ人間のプレイヤーのように振る舞えるかどうかをテストしました。結果として、AIは平均的な人間のプレイヤーと同じくらい上手にゲームをプレイできるようになり、最も下手なプレイヤーよりも優れたパフォーマンスを示しました。このAIは、一般的な強化学習(自分で試行錯誤しながら学習する方法)よりも人間らしい行動をすることができますが、最高のプレイヤーにはまだ及ばないパフォーマンスです。

  • 公開:2024-01-08


A Primer on Temporal Graph Learning

時間グラフ学習の入門書

  • Aniq Ur Rahman , Justin P. Coon


  • この本は「時間グラフ学習(TGL)」という技術をわかりやすく説明するために書かれています。TGLは、時間と空間の両方の情報を使って学習する方法で、例えば、過去のデータから未来を予測することができます。本書では、TGLを理解するために必要な基本的な概念を、簡単な説明と数学的な式を使って解説しています。また、TGLに関連するさまざまな技術、例えば、リカレント・ニューラル・ネットワークや畳み込みニューラル・ネットワーク、トランスフォーマー、グラフ・ニューラル・ネットワークなども紹介しています。さらに、TGLを使ってどのようにデータを解釈し、予測するかについても、古典的な時系列予測法を参考にしながら説明しています。

  • 公開:2024-01-08


A Philosophical Introduction to Language Models -- Part I: Continuity With Classic Debates

言語モデルへの哲学的導入 - 第I部:古典的な論争との連続性

  • Raphaël Millière , Cameron Buckner


  • GPT-4のような大規模な言語モデルは、人間のように言葉を使って様々なタスクをこなす能力が非常に高いです。これには、人間の知能で特別だと思われていたような複雑な作業も含まれます。しかし、これらのモデルが本当に言葉を理解しているのか、またどのように認知的な作業を行っているのかについては、専門家の間でも意見が分かれています。この議論は、人工知能がどのように人間の脳を模倣しているかについての長い歴史を持つ問題です。この論文は、言語モデルがどのように言語を学び、意味を理解し、知識を獲得するかなど、多くの重要なトピックを扱っています。言語モデルの進歩は、人工知能の理解に新たな疑問を投げかけており、これらのモデルがどのように機能するかをさらに深く探るための研究が求められています。

  • 公開:2024-01-08


A Survey on 3D Gaussian Splatting

3Dガウススプラッティングに関する調査

  • Guikun Chen , Wenguan Wang


  • 3Dガウシアンスプラッティング(3D GS)は、コンピュータグラフィックスの分野で新しい技術として注目されています。これは、数百万の3Dガウシアン(数学的な関数)を使って、物体の3D形状や外観を表現する方法です。従来のニューラル放射輝度場(NeRF)とは異なり、3D GSは明示的なシーンの表現と、変更可能なレンダリング(画像生成)アルゴリズムを使用します。これにより、リアルタイムでの画像生成が可能になり、シーンの編集や制御が前例なく容易になります。この技術は、バーチャルリアリティやインタラクティブメディアなど、さまざまな分野での応用が期待されています。この論文では、3D GSの基本原理、重要性、実用性について詳しく説明し、現在の課題と将来の研究方向を示唆しています。

  • 公開:2024-01-08


Boldly Going Where No Benchmark Has Gone Before: Exposing Bias and Shortcomings in Code Generation Evaluation

大胆に進む:ベンチマークがこれまでに行ったことのないところへ行く - コード生成評価のバイアスや不備を暴く

  • Ankit Yadav , Mayank Singh


  • 最近、人間が書いた説明からコンピューターのプログラムを自動生成する技術が注目されています。この技術を評価するために、Pythonというプログラミング言語でコードを生成するテストが使われています。しかし、この研究では、使われているテスト(HumanEvalとMBPPという名前のテスト)が十分に多様ではなく、簡単な問題が多すぎることを指摘しています。つまり、これらのテストでは、プログラミングのさまざまな側面や難しい問題があまり考慮されておらず、自動生成技術の能力を過大評価してしまう恐れがあるということです。

  • 公開:2024-01-08


A foundation for exact binarized morphological neural networks

正確なバイナリ化形態ニューラルネットワークの基盤

  • Theodore Aouad , Hugues Talbot


  • ディープニューラルネットワーク(NN)は、画像認識などの複雑なタスクをこなすための人工知能の一種ですが、これを動かすには高性能なコンピューター機器(GPUやTPU)と多くの電力が必要です。計算量と電力を減らすために、重み(NNの中でデータを処理する際の重要なパラメータ)を単純な「0か1」にする方法がありますが、この方法は学習が難しいという問題がありました。研究者たちは、数学的形態学という理論を使って、この問題を解決する新しい手法を提案しました。彼らは、NNが学習しやすくなるように、新しい近似法と最適化を助ける技術を開発しました。この研究により、NNを効率的に動かしながらも、画像分類などのタスクで高い性能を保つことが可能になるかもしれません。

  • 公開:2024-01-08


Deep Learning for Visual Neuroprosthesis

視覚ニューロプロステーシスのためのディープラーニング

  • Peter Beech , Shanshan Jia , Zhaofei Yu , Jian K. Liu


  • この文章は、私たちが見たものをどのように理解しているか、そしてその情報が脳でどのように処理されるかについての研究を説明しています。視覚経路とは、目から脳へと情報を伝える細胞や領域の複雑なつながりのことです。この経路は、私たちが見たものを解析し、理解するのに不可欠ですが、まだ完全には理解されていません。また、この文章は、視覚障害を持つ人々を助けるために、視覚経路を模倣する人工的な装置(神経人工器官)の開発の重要性についても触れています。これらの装置は、失われた視覚機能を補うために使われることがあります。最後に、ディープラーニングというコンピュータ技術を使って、視覚経路の仕組みを模倣するモデルを作ることの価値について議論しています。これらのモデルは、視覚の仕組みをより深く理解するのに役立ちます。

  • 公開:2024-01-08


Why Solving Multi-agent Path Finding with Large Language Model has not Succeeded Yet

なぜ大規模言語モデルを用いた複数エージェントの経路探索問題の解決にはまだ成功していないのか

  • Weizhe Chen , Sven Koenig , Bistra Dilkina


  • この文章は、最近の研究が大規模な人工知能(AI)モデル(例えば、ChatGPTやGPT-4)が多くの異なる問題を解決できることを示しているが、複数のエージェント(例えば、ロボットやプログラム)が協力して計画を立てる「マルチエージェント計画」という分野についての研究は少ないと述べています。この論文では、特に複数のロボットが衝突せずに目的地に移動する計画を立てる問題(マルチエージェント経路探索、MAPF)に焦点を当て、AIモデルを使ってこの問題を解決しようとする試みについて説明しています。研究者たちは、障害物がない環境での成功例と、より複雑な環境での失敗例を示し、AIモデルがこの問題を解決するのに苦労している理由についての仮説を提案し、実験を通じてその考えを支持しています。

  • 公開:2024-01-08


A Wasserstein Graph Distance Based on Distributions of Probabilistic Node Embeddings

確率的ノード埋め込みの分布に基づくワッサーシュタイングラフ距離

  • Michael Scholkemper , Damin Kühn , Gerion Nabbefeld , Simon Musall , Björn Kampa , Michael T. Schaub


  • この研究は、異なるグラフ(ネットワークやデータの構造)の間の距離を測る新しい方法について説明しています。グラフをガウス混合モデル(データを複数の正規分布の組み合わせで表現する方法)として表し、これらのモデル間の距離をワッサーシュタイン距離という計算法で測ります。この距離は理解しやすく、計算もしやすいです。また、異なる状況に合わせて調整することができます。研究者たちはこの方法を使って、特定の条件下で計算をさらに効率的にする方法も提案しています。実際の脳のネットワークデータを使った実験では、この方法が他の一般的な方法よりも良い結果を出すことを示しています。

  • 公開:2024-01-08


Incremental Learning of Stock Trends via Meta-Learning with Dynamic Adaptation

メタラーニングと動的適応を用いた株式トレンドのインクリメンタル学習

  • Shiluo Huang , Zheng Liu , Ye Deng , Qing Li


  • 株価の動きを予測することは金融とテクノロジーの分野で重要な課題です。株式市場は常に変化しているため、予測モデルも定期的に更新する必要があります。しかし、多くの既存の方法は、市場の変化に対応するために過去の繰り返しパターンを活用していません。この問題を解決するために、新しい「メタ学習」という技術を使った方法(MetaDA)が提案されました。この方法では、予測モデルが新しいデータと過去の重要なデータを組み合わせて学習します。特別なネットワークがどの過去のデータが役立つかを判断し、モデルがより正確に株価のトレンドを予測できるようにします。この新しい方法は実際の株式市場のデータでテストされ、高い精度で予測することができました。

  • 公開:2024-01-08


IDoFew: Intermediate Training Using Dual-Clustering in Language Models for Few Labels Text Classification

IDoFew:少数のラベルを持つテキスト分類のための言語モデルのデュアルクラスタリングを使用した中級トレーニング

  • Abdullah Alsuhaibani , Hamad Zogan , Imran Razzak , Shoaib Jameel , Guandong Xu


  • BERTのような言語モデルは、文章を分類するなどの言語処理に優れていますが、データが少ない場合にはうまく機能しないことがあります。これを解決するために、新しい手法「IDoFew」が開発されました。この手法では、文章のグループ(クラスター)を作ることで、モデルが文章を分類する際の手がかりとなる擬似ラベルを生成します。2種類のクラスタリング手法を組み合わせることで、より正確な擬似ラベルを作り出し、その後のモデルの微調整に役立てます。これにより、他の手法よりも正確に文章を分類できるようになります。

  • 公開:2024-01-08


TextMachina: Seamless Generation of Machine-Generated Text Datasets

TextMachina: 機械生成テキストデータセットのシームレスな生成

  • Areg Mikael Sarvazyan , José Ángel González , Marc Franco-Salvador


  • 最近の大規模言語モデル(LLM)は、人間のような文章を作る技術が進歩し、多くの新しい用途が生まれています。しかし、誰でも簡単に使えるようになったことで、悪用されるリスクも増えています。この問題に対処するため、研究者たちは、機械が生成したテキスト(MGT)を見分けるためのモデルを訓練するのに役立つデータセットを作っています。これらのデータセットを作る際には、似たような方法が使われていますが、まだ統一的なツールはありません。「textmachina」というツールは、このようなデータセットを作るのを手助けするために設計されており、使いやすい仕組みを提供しています。これにより、言語モデルを組み合わせたり、偏りを減らしたりする作業が簡単になります。textmachinaで作られたデータセットは、多くの研究チームがMGTを見分けるモデルを訓練するために使われ、その品質が評価されています。

  • 公開:2024-01-08


Language Models Understand Numbers, at Least Partially

言語モデルは数字を理解しています、少なくとも部分的には。

  • Fangwei Zhu , Damai Dai , Zhifang Sui


  • この文章は、大規模な人工知能(AI)言語モデルが数学の問題をどのように理解して解くかについての研究を説明しています。言語モデルは、文章を読んだり書いたりするのに優れていますが、数学の問題を解くには数字を理解し、それを内部で処理する能力が必要です。研究者たちは、足し算の問題を使ってAIが数字をどのように扱っているかを調べました。彼らは、AIが数字を内部で「圧縮」していることを発見しましたが、この圧縮された情報から元の数字を完全に取り戻すのは難しいことがわかりました。それでも、AIはこの圧縮された情報を使って計算を行うことができ、AIの大きさが大きくなるほど計算能力も向上することが示されました。この研究は、AIが数学の問題をどの程度理解しているかについての初歩的な洞察を提供しています。

  • 公開:2024-01-08


A Content-Based Novelty Measure for Scholarly Publications: A Proof of Concept

学術論文に対する内容ベースの新規性評価尺度:概念の証明

  • Haining Wang


  • この文章は、科学研究の新しいアイデアや発見をどのように評価するかについて説明しています。新しい研究がどれだけ「新しい」かを判断するために、専門家による査読が重要ですが、提出される研究の数が多いため、新規性を自動的に評価する方法が必要です。このため、研究の新規性を測る新しい方法が提案されています。この方法は、研究内容が既知の知識とどれだけ異なるかを計算することで、「驚き」の度合いを数値化します。この数値は、科学の常識とどれだけ違うか、また専門家の評価とどれだけ一致するかに基づいています。この新しい尺度は、新規性だけでなく、創造性や学際性など科学の進歩に関連する他の要素との関係も理解するのに役立ちます。

  • 公開:2024-01-08


Exploratory Evaluation of Speech Content Masking

話し言葉の内容マスキングの探索的評価

  • Jennifer Williams , Karla Pizzi , Paul-Gauthier Noe , Sneha Das


  • この論文は、音声の中の特定の単語やフレーズを隠すことでプライバシーを保護する新しい技術について説明しています。この技術は「コンテンツマスキング」と呼ばれ、音声から選択された部分を隠すことで、その内容を秘密に保つことができます。研究者たちは、音声をデジタル信号に変換し、その中から特定の部分を変更することでマスキングを行います。彼らはノイズの追加、単語の削除、音の順序を逆にするといった異なる方法を試し、これらが音声認識や話者の識別にどのような影響を与えるかを調べました。この研究は、音声データのプライバシーを守るための新しい手法を提案しており、音声認識技術の発展に伴うプライバシーの問題に対処するための一歩となります。

  • 公開:2024-01-08


Analysis of Blockchain Integration in the e-Healthcare Ecosystem

電子医療エコシステムにおけるブロックチェーン統合の分析

  • Abdellah Ouaguid , Mohamed Hanine , Zouhair Chiba , Noreddine Abghour , Hassan Ghazal


  • ブロックチェーン技術は、医療分野での革命的な変化をもたらしています。この技術を使うことで、患者の電子カルテの安全な管理や、医療情報の共有が改善され、よりセキュアで柔軟な医療システムが実現しています。研究では、ブロックチェーンを使った医療データ管理の方法を比較し、それぞれの長所と短所を明らかにしています。これにより、特定の医療環境に最適なブロックチェーンの使い方を選ぶ手助けをしています。しかし、ブロックチェーンを医療に効果的に取り入れるためには、まだ解決すべき課題があります。これには、国際的な法律の調和や、倫理的な基準の遵守、関係者間の協力が必要です。

  • 公開:2024-01-08


Inferring Properties of Graph Neural Networks

グラフニューラルネットワークの特性を推測する

  • Dat Nguyen , Hieu M. Vu , Cong-Thanh Le , Bach Le , David Lo , Corina Pasareanu


  • グラフ・ニューラル・ネットワーク(GNN)は、点と線でつながったデータ(グラフ構造)を扱うための先進的なコンピューター技術です。この技術は、人々や物事の関係性を分析する際に有効で、例えば、人々の交流を表すソーシャルネットワークの分析や、さまざまな情報が結びついた知識グラフの解析に使われます。また、GNNは医療分野にも応用されており、新型コロナウイルスの検出やワクチンの開発に役立てられていることがあります。これらの問題に対して、GNNはデータの複雑な関係性を理解し、予測や推薦などのタスクを効果的に行うことができます。

  • 公開:2024-01-08


Cybersecurity in Critical Infrastructures: A Post-Quantum Cryptography Perspective

重要インフラのサイバーセキュリティ:ポスト量子暗号の視点

  • Javier Oliva del Moral , Antonio deMarti iOlius , Gerard Vidal , Pedro M. Crespo , Josu Etxezarreta Martinez


  • 工場などの産業環境で使われる機械は、性能向上のためインターネットに繋がれていますが、それによりサイバー攻撃を受けやすくなりました。これは機械が正常に動かなくなるリスクを高め、経済的・社会的な問題を引き起こす可能性があります。最近、サイバーセキュリティの資源が不足しており、攻撃が増えています。産業用機器は古い技術や限られた計算能力を持つため、通信の安全を保つための暗号化が難しいです。さらに、量子コンピュータの発展は、現在の暗号を破る能力を持つため、新たな脅威となっています。このため、量子コンピュータに耐えうる新しい暗号技術(量子鍵配送やポスト量子暗号)が提案されていますが、これらは主に情報技術の分野で考えられており、産業環境に適用するには問題があります。この論文では、産業環境における情報セキュリティの問題点を整理し、適切な暗号方式を分析しています。

  • 公開:2024-01-08


RudolfV: A Foundation Model by Pathologists for Pathologists

RudolfV: 病理医による病理医のための基礎モデル

  • Jonas Dippel , Barbara Feulner , Tobias Winterhoff , Simon Schallenberg , Gabriel Dernbach , Andreas Kunft , Stephan Tietz , Philipp Jurmeister , David Horst , Lukas Ruff , Klaus-Robert Müller , Frederick Klauschen , Maximilian Alber


  • 病理組織学は病気の診断に不可欠で、人工知能(AI)がその分析を助ける技術が進歓しています。しかし、珍しい病気のデータは少なく、AIがこれらの病気を学ぶのは難しいです。この研究では、まずラベルのない大量のデータからAIが基本的な知識を学び、それを基礎として使います。研究者たちは、ヨーロッパとアメリカの異なる病院から集めた約1億3000万枚のスライド画像を使い、AIが病理画像を理解するためのモデルを作りました。このモデルは、病理医の知識を取り入れ、少ないデータで学習しても他のモデルと同じかそれ以上の性能を示しました。この技術がさらに発展すれば、より複雑な実世界の医療診断や研究に役立つと期待されています。

  • 公開:2024-01-08


Fun with Flags: Robust Principal Directions via Flag Manifolds

Fun with Flags: Flag Manifoldsを介した堅牢な主方向

  • Nathan Mankovich , Gustau Camps-Valls , Tolga Birdal


  • 主成分分析(PCA)は、データの重要な特徴を抽出するために使われる技術です。この論文では、PCAを改良し、データの異常値や複雑な構造(多様体)にも対応できる新しい方法を提案しています。従来のPCAはデータの分散を最大にするか、再構成誤差を最小にすることで機能しますが、著者たちはこれを一般化し、より幅広い状況に適用可能なアルゴリズムを開発しました。これを実現するために、「フラグ」という概念を用いて、PCAの問題を数学的に再構成し、新しいアルゴリズムのバリエーションを生み出しています。また、効率的な計算方法も提案しており、実際のデータとシミュレーションデータでこの新しいアプローチの有効性を実証しています。特に、データの異常値に強いという点が強調されています。

  • 公開:2024-01-08


Multi-scale attention-based instance segmentation for measuring crystals with large size variation

大きなサイズの変動を持つ結晶を測定するためのマルチスケールアテンションベースのインスタンスセグメンテーション

  • Theresa Neubauer , Astrid Berg , Maria Wimmer , Dimitrios Lenis , David Major , Philip Matthias Winter , Gaia Romana De Paolis , Johannes Novotny , Daniel Lüftner , Katja Reinharter , Katja Bühler


  • 高解像度の画像で結晶の大きさを正確に測ることは、材料の特性を理解するのにとても重要です。しかし、結晶の大きさがバラバラだったり、境界がはっきりしない画像では、今までの技術では正確な測定が難しいです。小さなエラーでも測定結果に大きな影響を与える可能性があります。私たちは、より正確な測定ができる新しい方法を提案します。この方法は、異なる大きさの情報を組み合わせて、結晶の境界をよりはっきりさせる「マルチスケールアテンションモジュール」という技術を使います。これにより、結晶のサイズを今までよりも正確に計算できることが実証されました。特に、結晶のサイズが不揃いな高解像度画像において、この新しい方法が既存の技術より優れていることを示しています。

  • 公開:2024-01-08


D3PRefiner: A Diffusion-based Denoise Method for 3D Human Pose Refinement

D3PRefiner:3D人間の姿勢を洗練させるための拡散ベースのノイズ除去手法

  • Danqi Yan , Qing Gao , Yuepeng Qian , Xinxing Chen , Chenglong Fu , Yuquan Leng


  • 単眼カメラで人の3D姿勢を推定する技術は、実現が比較的容易で日常のデータが豊富なため注目されています。しかし、この方法は画像の奥行き情報が不確かなため、推定される姿勢には誤差(ノイズ)が多く含まれます。研究者たちは、このノイズを分析し、ニューラルネットワークがノイズのある姿勢と正確な姿勢の関係を学習できることを見出しました。そこで、彼らはD3PRefinerという新しい技術を開発し、ノイズのある3D姿勢をより正確なものに改善する方法を提案しました。この技術は、2D姿勢とノイズのある3D姿勢のペアを使って、ノイズの分布をモデル化し、その分布を真の3D姿勢に変換します。実験では、この新しいアーキテクチャが既存の3D姿勢推定器の性能を大幅に向上させることが示され、姿勢推定の誤差が少なくとも10.3%減少しました。

  • 公開:2024-01-08


Monitoring water contaminants in coastal areas through ML algorithms leveraging atmospherically corrected Sentinel-2 data

MLアルゴリズムを活用した大気補正されたセンチネル-2データを使用した沿岸地域の水質汚染のモニタリング

  • Francesca Razzano , Francesco Mauro , Pietro Di Stasio , Gabriele Meoni , Marco Esposito , Gilda Schirinzi , Silvia Liberata Ullo


  • 水の濁り度を測ることは、人々の健康と環境を守るためにとても大切です。研究者たちは、濁り度を監視する新しい方法を開発しました。これは、CatBoostという機械学習技術を使い、衛星からの高解像度画像データと組み合わせることで、水質の汚染をより正確に予測します。従来の方法よりも手間がかからず、効率的です。さらに、Google Earth Engineを使って得たデータを活用し、香港のモニタリングステーションのデータと組み合わせることで、地域に合った詳細な情報を提供します。この新しい方法は、世界中で水質を管理するための先進的な技術を使う基盤を作ります。

  • 公開:2024-01-08


InvariantOODG: Learning Invariant Features of Point Clouds for Out-of-Distribution Generalization

不変OODG:分布外汎化のための点群の不変特徴の学習

  • Zhimin Zhang , Xiang Gao , Wei Hu


  • 3Dセンサーは、物体や環境を立体的に捉える技術で、様々な場面で使われています。しかし、異なるデバイスや状況で得られる3Dの点の集まり(点群データ)は、その特性が変わることがあります。これに対応するため、我々は「InvariantOODG」という新しい方法を提案しました。この方法では、2つの異なるアプローチを使って、点群データの特徴を学習します。一つは、点群の中で重要な位置(アンカー点)を見つけ出すこと、もう一つは、点群データを変形させて学習することです。これにより、どんなデバイスや状況から得られたデータでもうまく扱えるようになります。実験では、この方法が3Dデータを上手く一般化して扱えることを示しています。

  • 公開:2024-01-08


3D-SSGAN: Lifting 2D Semantics for 3D-Aware Compositional Portrait Synthesis

3D-SSGAN:3Dを意識した構成的な肖像合成のための2Dセマンティクスの向上

  • Ruiqi Liu , Peng Zheng , Ye Wang , Rui Ma


  • 既存の3Dを考慮した肖像画生成技術は、リアルな3Dの見た目を維持しながら高品質な画像を作ることができますが、画像の細かい部分を個別に調整することは難しいです。一方で、2Dの技術では顔の部分を細かく分けることはできますが、3Dの一貫性を保つことができません。この問題を解決するために、3D-SSGANという新しい技術が提案されました。これは、2Dで作られた顔のパーツを3Dに変換し、リアルな3D肖像画を作ることができる技術です。この技術は、実際の顔の画像と合成された画像を比較することで学習し、3Dの見た目が一貫していると同時に、顔の各部分を個別に調整できるようにします。評価では、この技術が3Dの一貫性を保ちながら細かい部分の調整が可能であることが示されています。

  • 公開:2024-01-08


Sur2f: A Hybrid Representation for High-Quality and Efficient Surface Reconstruction from Multi-view Images

Sur2f:マルチビュー画像からの高品質で効率的な表面再構築のためのハイブリッド表現

  • Zhangjin Huang , Zhihao Liang , Haojie Zhang , Yangkai Lin , Kui Jia


  • 多視点表面再構成は、複数の画像から物体の3D形状を作り出す技術です。従来の方法では、物体の表面をメッシュ(網目状の構造)で作るか、またはボリューム(空間内の塊)として表現していました。この研究では、Sur$^2$fという新しい手法を提案しており、メッシュとボリュームの両方の利点を組み合わせています。Sur$^2$fは、メッシュの形状を調整するためにボリュームの情報を使い、さらにメッシュを使ってボリュームの計算を効率的に行います。これにより、3D形状の再構成がより正確かつ効率的になります。実験では、Sur$^2$fが他の方法よりも品質と効率の面で優れていることを示しています。

  • 公開:2024-01-08


DME-Driver: Integrating Human Decision Logic and 3D Scene Perception in Autonomous Driving

DME-Driver:自律走行における人間の意思決定ロジックと3Dシーン認識の統合

  • Wencheng Han , Dongqian Guo , Cheng-Zhong Xu , Jianbing Shen


  • 自動運転車のシステムであるDME-Driverは、人間のように論理的に判断し、正確に環境を認識することができます。このシステムは、大規模なビジョン言語モデルを使って、人間のドライバーがどう考えるかを学び、その知識を使って自動車が運転中に判断を下します。また、3D環境を詳細に理解するモデルを使って、その判断を正確な運転操作に変換します。このシステムを訓練するために、様々な人間の運転行動を含む新しいデータセットを作成しました。これにより、DME-Driverは信頼性が高く、説明可能な運転判断を行いながら、正確な運転を実現します。

  • 公開:2024-01-08


Identifying Fabricated Networks within Authorship-for-Sale Enterprises

筆者買収企業内の偽造されたネットワークの特定

  • Simon J. Porter , Leslie D. McIntosh


  • この文章は、偽造された科学論文を見つけ出すための新しい方法について説明しています。偽造論文は、実際には研究に関わっていない人々が著者として名を連ねることが多く、これらの著者はお金などの取引で名前を貸していることがあります。このような論文は、著者同士が実際には深い関係を持っていないため、同じ人が何度も共著者として現れることは少ないです。研究者たちは、このような偽造論文の著者ネットワークを特定するためのモデルを作り、それを使って偽造論文を検出する効果的な方法を提案しています。この方法は、既存のテキスト分析による検出方法と組み合わせて使うことで、より多くの偽造論文を見つけることができます。また、この研究では、偽造論文のネットワークがどのように広がっていくか、そしてそれをどう防ぐかについても議論しています。

  • 公開:2024-01-08


The Complexity of Simplifying $ω$-Automata through the Alternating Cycle Decomposition

$ω$-オートマトンを交互サイクル分解を通じて単純化する複雑さ

  • Antonio Casares , Corto Mascle


  • 2021年にCasares、Colcombet、Fijalkowは、コンピュータがある種の問題を解決するために使う「ミュラーオートマトン」というシステムを、より効率的に扱える「パリティオートマトン」という形に変換する方法を研究しました。彼らは「交互サイクル分解(ACD)」という新しい手法を開発し、これを使ってミュラーオートマトンの特性を効率的に分析できることを示しました。具体的には、この手法を使うことで、ミュラーオートマトンがどのようなルールで動いているかを多項式時間(つまり、計算時間が問題の大きさに対して合理的な範囲で増加する)で理解できることを証明しました。しかし、オートマトンの構造を詳細に考慮すると、問題はより複雑になり、解決が難しくなることも示しています。

  • 公開:2024-01-08


Sparse Meets Dense: A Hybrid Approach to Enhance Scientific Document Retrieval

Sparse Meets Dense: 科学文書検索を強化するハイブリッドアプローチ

  • Priyanka Mandikal , Raymond Mooney


  • 従来の情報検索システムは、文書や検索クエリを単語の集まりとして扱い、それらの関連性を見つけるために単純な方法を使っていました。しかし、最新の技術では「ディープラーニング」と呼ばれる方法を使い、文書やクエリをより複雑で密度の高い数値の集まり(ベクトル)として表現して、より精度の高い検索を可能にしています。研究者たちは、特に医療分野の文書検索において、古い方法と新しい方法が似たような結果を出すことを発見しました。ただし、最新の高度なモデル(SPECTER2)を使っても、検索性能が大幅に向上するわけではないことがわかりました。それでも、古い方法と新しい方法を組み合わせた「ハイブリッドモデル」を使うと、検索性能が大きく改善されることが示され、この組み合わせが専門的な文書検索において有効であることが強調されました。

  • 公開:2024-01-08


Recognizing Similar Crises through the Application of Ontology-based Knowledge Mining

オントロジーベースの知識マイニングを通じて類似した危機を認識する

  • Ngoc Luyen Le , Marie-Hélène Abel , Elsa Negre


  • この研究は、さまざまな危機(災害や緊急事態など)に関する情報を整理し、似たような危機を見つけ出す方法についてです。研究者たちは、危機に関する詳細な情報を集めた「知識ベース」というデータベースを使い、危機同士の類似点を見つけるための尺度を開発しました。この方法を使うことで、以前に似たような危機があった場合に、それを素早く認識し、過去の経験から学んで効果的な対策を立てることができます。実験では、この方法が正確で効率的に危機を認識できることを証明し、危機管理の改善に役立つことを示しています。

  • 公開:2024-01-08


Modeling AoII in Push- and Pull-Based Sampling of Continuous Time Markov Chains

連続時間マルコフ連鎖のプッシュおよびプルベースのサンプリングにおけるAoIIのモデリング

  • Ismail Cosandal , Nail Akar , Sennur Ulukus


  • この文章は、情報を遠隔で監視するシステムにおいて、情報がどれだけ新鮮かを測る新しい方法「Age of incorrect information (AoII)」について説明しています。従来の方法と違い、AoIIは情報が正確で同期している間は時間が経つにつれて増加し、誤った情報があるとリセットされることで、不正確な情報にペナルティを与えます。この論文では、情報をどのタイミングでサンプリング(取得)し送信するかについて、プッシュ(自動送信)とプル(要求時のみ送信)の二つの方法を分析する新しいモデルを提案しています。このモデルは、情報の状態が変わるタイミングを正確に把握するための数学的理論を使っており、どのサンプリング方針が最も効率的かを計算することができます。数値的な結果を通じて、このモデルが有効であることを示し、最適なサンプリング方針についての理解を深めることができます。

  • 公開:2024-01-08

この記事が気に入ったらサポートをしてみませんか?