見出し画像

Investigation of normalization procedures for transcriptome profiles of compounds oriented toward practical study design

https://www.biorxiv.org/content/10.1101/2023.10.01.560398v1

  1. 本研究の学術的背景と中心的な問いは、トランスクリプトームプロファイル(遺伝子発現プロファイル)を用いた化合物効果の解析方法に関して、特に実験環境や試料数等の差異(バッチ差異)が存在する場合にどのように解析結果を安定的に得るかという問いです。

  2. 本研究の目的は、トランスクリプトームプロファイルによる解析結果に影響するバッチ差異を最小限に抑えるための基準を明らかにし、特に試料数が少ない場合でもロバスト(頑強)な解析結果を得るための手法を提案することです。これは一般的に試料数が多ければ多いほど解析結果の信頼性が上がるが、実際の解析ではそれが難しい場合も多いため、その問題点を解決する新たなアプローチです。

  3. 化合物効果の解析には伝統的に化合物の構造情報をもとにした手法が多く用いられてきましたが、最近では遺伝子発現プロファイルに基づく手法も活用されています。この手法は、化合物の構造が不明な場合や複数の化合物が混ざった複雑な環境下でも評価可能である一方、データを得るのに実験が必要で、試験毎や施設間でのバッチ差異が無視できない問題がありました。これまでにもその差異を取り扱うための方法は研究されてきましたが、まだ完全な解決策は見つかっていません。このような背景から、特に試料数が少ない場合にバッチ差異を考慮に入れた解析方法を提案することで、この分野の研究に貢献することを目指しています。

  4. 大規模な遺伝子発現データセットを用いて、異なる正規化手法の影響を比較しました。その結果、バッチごとに全サンプルで定義される基準分布が、大規模データセットのための優れた選択肢であることを明らかにしました。また、コントロール試料の数が結果のロバスト性にどのように影響するかを模擬実験で調査した結果、小規模データセットではコントロール試料数が6個以上であることが理想的であることを示しました。

  5. 本研究の有効性は、異なるデータセットでの同一化合物の遺伝子発現プロファイルの類似性に基づいて評価されました。具体的には、大規模データセットを基準に、試料数が少ないデータセットの解析結果と比較して評価しました。

この記事が気に入ったらサポートをしてみませんか?