見出し画像

MELLODDY: Cross-pharma Federated Learning at Unprecedented Scale Unlocks Benefits in QSAR without Compromising Proprietary Information

https://pubs.acs.org/doi/10.1021/acs.jcim.3c00799

**1. この研究の学術的背景と核心となる学術的な問いは何か?**
この研究は、機械学習モデルの予測性能を向上させるために用いられる「フェデレーテッドマルチパートナーマシンラーニング」を基に行われています。特に、訓練データを生成するのに大量のリソースが必要な分野で、効果的に訓練データ量を増やす手段として注目されています。そこで、本研究の核心的な問いは、このフェデレーテッド学習を用いて、複数の製薬会社が自身のモデルを改善することは可能なのか、という点です。

**2. この研究の目的及び学術的独自性と創造性は何か?**
本研究の目的は、フェデレーテッド学習を用いて、製薬会社各社が独自に保有する大量のデータを有効活用し、予測モデルの性能向上を実現することです。学術的な独自性や創造性としては、これまでのフェデレーテッド学習に加え、マルチタスク学習を取り入れ、それをパートナー間で展開する新たな実装を取り入れています。

**3. この研究のアイデアはどこから来たのか、また国内外の研究動向とこの研究の位置づけは?**
フェデレーテッドマルチパートナーマシンラーニングは、個別のデータを一元化せずに、各社のデータセンター内で学習が行われるため、プライバシーやセキュリティの保護と高い予測性能を両立することができます。これは、各製薬会社が保有する大量の医薬品開発に関する試験データの活用を可能にした点で、国際的な研究動向の中で重要な位置を占めています。

**4. この研究で何をどのように、どこまで明らかにした?**
この研究では、10社以上の製薬会社が参加するMELLODDYプロジェクトという前例のない大規模な研究において、各社がフェデレーテッド学習を活用し、それぞれ独自の分類や回帰モデルの性能向上を実現しました。それらの結果は、26億以上の実験活性データ、2100万以上の物理的な小分子、幅広い試験データを元にしています。

**5. この研究の有効性をどのように検証した?**
この研究の有効性を検証するために、フェデレーテッド環境での予測性能を評価するための補完的なメトリクスが開発されました。また、ラベル付き空間での予測性能だけでなく、フェデレーテッド学習の適用範囲の拡大も示されています。

この記事が気に入ったらサポートをしてみませんか?