新しいアルゴリズムがマイクロバイオームデータをかつてない効率で浄化する


新しいアルゴリズムがマイクロバイオームデータをかつてない効率で浄化する

https://phys.org/news/2023-06-algorithm-microbiome-unprecedented-efficiency.html

0
2023年6月13日
0
生物学

細胞・微生物学
生物学

バイオテクノロジー
編集後記
新しいアルゴリズムがマイクロバイオームデータをかつてない効率で浄化する
ロックフェラー大学
SCRuBは、シミュレーションされたベンチマークで優れた除染を実証した。Credit: Nature Biotechnology (2023). DOI: 10.1038/s41587-023-01696-w
私たちの誰もが、完全に機能する免疫系を持って生まれてくるわけではなく、生後数カ月は、生涯にわたって強力な防御を確立するために極めて重要です。しかし、科学者は長年、最も基本的な質問に答えることができませんでした。それは、子宮の中、あるいは私たちが初めて社会に出た瞬間、どこで予防接種が始まるのだろうかということです。
胎盤のスライスを顕微鏡で観察し、微生物の群れを探せばいいのです。しかし、2014年以降、このテーマで6本以上の論文が一流誌に掲載され、3本は微生物を示し、3本は何も示さないという、決定的な答えに近づいていないのです。
問題はコンタミネーションです。科学者はサンプルに含まれる微生物の遺伝情報のごくわずかな痕跡を検出することができますが、皮膚や試薬、実験器具に付着した汚染物質と本来の細菌やウイルスを区別することは困難であることが分かっており、一部の研究で胎盤から見つかった微生物が技術者の作業前に存在していたかどうかはまだ不明です。
この難問を解決する鍵は、SCRuBと呼ばれる新しいアルゴリズムによって、研究者が前例のない効率でマイクロバイオームデータから汚染を取り除くことができるようになったことです。
「ロックフェラーの物理学・生物学研究センターの独立研究員で、このプロジェクトを率いたLiat Shenhav氏は、「私たちの重要な洞察は、特定の微生物が汚染物質であるかどうかを特定しようとするのではなく、汚染源全体をモデル化することでした。
サンプルの汚染除去に微妙なアプローチを取ることで、科学者は、いわゆるネガティブコントロール(テストサンプルと一緒に処理した空白のサンプル)をより有効に活用して、汚染除去を行うことができます。SCRuBは非常に特異的で、特に汚染物質として存在する微生物と、本来の居住者として存在する微生物とで優れた性能を発揮します。「SCRuBは、現在の最先端手法を平均15~20倍も上回る性能を発揮する。
その成功を受けて、開発者はSCRuBがマイクロバイオーム研究に広く応用できないかと考えた。例えば、メラノーマ患者が免疫療法に反応するかどうかを予測するには、それぞれの腫瘍に生息する微生物を正確に分析し、特定の除染を行うことが重要であることを明らかにしました。また、このアルゴリズムは、既存の方法よりもメラノーマ患者をよりよく分類できることを示しました。
Shenhav氏と共同研究したコロンビア大学のTal Korem氏は、「微生物群集に関する我々の理解は、まだ表面的なものに過ぎません」と述べています。「この分野では、多様な身体部位から、驚異的なスピードでデータが生成されています。これらの研究はすべて、我々の方法を用いた正確な除染から恩恵を受けることができます。"
より詳しい情報はこちら George I. Austin et al, Contamination source modeling with SCRuB improves cancer phenotype prediction from microbiome data, Nature Biotechnology (2023). DOI: 10.1038/s41587-023-01696-w
ジャーナル情報です: ネイチャーバイオテクノロジー
提供:ロックフェラー大学


公開日:2023年3月16日
SCRuBによる汚染源モデリングがマイクロバイオームデータからのがん表現型予測を向上させる
ジョージ・I・オースティン
ヒーク・パーク
...
タル・コレム
著者を表示する
ネイチャーバイオテクノロジー (2023)この記事を引用する
4280 アクセス数
115 Altmetric
指標詳細
概要
微生物コミュニティの解析のためのシーケンスベースのアプローチは、生物学的シグナルを隠したり、人工的なシグナルを生成する可能性のある汚染の影響を受けやすいものである。対照物質を用いたin silico除染の方法は日常的に使用されているが、サンプル間で共有される情報を最適に利用することはできず、汚染や対照物質への生物学的物質の漏れに部分的に由来する分類群を扱うことはできない。ここでは、複数のサンプルとコントロールにまたがる共有情報を取り入れ、汚染を正確に特定・除去する確率的インシリコ汚染除去法、Source tracking for Contamination Removal in microBiomes (SCRuB)を紹介します。SCRuBは、複数のデータ駆動型シミュレーションと、誘発された汚染を含む実験でその精度を検証し、最先端の手法を平均15~20倍上回ることを実証しました。また、複数の生態系、データタイプ、シーケンス深度にわたるSCRuBの堅牢性を紹介します。SCRuBはマイクロバイオーム研究への応用が可能であることを示し、宿主の表現型の予測を向上させました。特に、腫瘍マイクロバイオームの汚染除去データを用いたメラノーマ患者の治療反応予測はその典型です。
このコンテンツは、購読コンテンツのプレビューです。
アクセス方法
所属機関を通じてアクセスする
Natureおよびその他54誌のNature Portfolioジャーナルにアクセスする
Nature+(ネイチャー・プラス)、お得なオンラインアクセス購読
24,99 € / 30日間
いつでもキャンセル可能
詳しくはこちら
日本のお客様向け定期購読情報
日本のお客様のために、専用のウェブサイトをご用意しました。本誌の購読をご希望の方は、natureasia.comにアクセスしてください。
natureasia.comへ移動する
この記事をレンタルまたは購入する
必要な期間、この記事だけを入手する
$39.95
もっと詳しく
価格には税金が加算される場合があります。
アクセス方法を追加しました:
ログイン
機関投資家向け定期購読について
FAQを見る
カスタマーサポートに問い合わせる
データの入手方法
私たちの実験のシーケンスデータは、すべての関連するメタデータとともにSRAにアップロードされ、アクセッションPRJNA905430(参考文献55)。本研究で分析した他のすべてのデータセットは、一般に公開されています。図1および拡張データ図3-5で使用した大学寮のデータセット25は、European Nucleotide Archive (ENA), accession ERP115809, Qiita41, study ID 12470から入手できます。Extended Data Fig. 3a,bで使用した海洋堆積物データセットは、Qiita41, study ID 11922から入手可能です。Extended Data Fig.3c,dで使用した魚類マイクロバイオームデータセット42は、ENAのアクセッションPRJEB54736とQiita41の研究ID13414から入手可能である。Extended Data Fig.3e,fで使用したEarth Microbiome Project soil dataset43は、ENA, accession PRJEB42019, and Qiita41, study ID 13114から入手可能です。拡張データ図3g,hで使用したオフィスデータセット44は、ENA, accession PRJEB13115, and Qiita41, study ID 10423から入手可能である。Extended Data Fig.3i,jで使用したセントラルパークの土壌データセット45は、ENA, accession PRJEB6614, and Qiita41, study ID 2104から入手できます。Extended Data Fig.3k,lで使用した腸内メタゲノムデータセット46は、ENA, accession PRJEB50408, and Qiita41, study ID 13692から入手可能です。図1、および拡張データ図3a〜f、4、5で使用したネガティブコントロールデータセットは、Qiita41、研究ID 12019から入手可能であり、拡張データ図3g、h、k、lで使用したものは、ENA、アクセッションPRJEB40903、およびQiita41、研究ID 12201から、拡張データ図3i、jで使用したものはENA、アクセッションPRJEB25617、およびQiita41、研究ID 10333から入手可能。well-to-well leakageデータセット32, は、ENA, accession ERP115213 から入手可能である。血漿cfDNAデータ20は、ENA、アクセッションERP119598、ERP119596、ERP119597、およびQiita41、研究ID12667、12691、12692から入手できる。腫瘍マイクロバイオームデータセット18は、SRA、アクセッションPRJNA624822から入手できます。処理されたデータは、文献のSupplementary Table 2から入手した。18.
コードの利用可能性
SCRuBはhttps://github.com/Shenhav-and-Korem-labs/SCRuB56、R (≥3.6.3)、glmnet57 (4.1-4) および torch (1.3.1) を必要とします。本論文のすべての解析を再現したCode Oceanカプセルは、https://codeocean.com/capsule/5737862/tree/v1(参考文献58)で入手可能で、ソースコードもhttps://github.com/Shenhav-and-Korem-labs/SCRuB_analysis で入手できます。どちらもtidyverse59 (0.7.2)とXGBoost60 (1.5.0)を使用しています。Nejmanら18が使用した除染パイプラインはZenodoからhttps://doi.org/10.5281/zenodo.3740536、Pooreら20が使用した予測パイプラインはhttps://github.com/biocore/tcga、入手可能です。
参考文献
Salter, S. J. et al. Reagent and laboratory contamination can critically impact sequence-based microbiome analyses. BMC Biol. 12, 87 (2014).
記事 PubMed PubMed Central Google Scholar
Weyrich, L. S. et al. 低バイオマス・サンプル解析における経時的なラボの汚染。Mol. Ecol. Resour. 19, 982-996 (2019).
記事CAS PubMed PubMed Central Google Scholar
Kim, D. et al. マイクロバイオーム研究における手法の最適化と落とし穴の回避. Microbiome 5, 52 (2017).
記事 PubMed PubMed Central Google Scholar(パブメドセントラルグーグルスカラー
Eisenhofer, R. et al. 低微生物バイオマスのマイクロバイオーム研究における汚染:問題点と提言。トレンド・マイクロバイオル(Trends Microbiol). 27, 105-117 (2019).
記事CAS PubMed Google Scholar
Weiss, S. et al. Tracking down the sources of experimental contamination in microbiome studies. Genome Biol. 15, 564 (2014).
記事 PubMed PubMed Central Google Scholar
Aagaard, K. et al. The placenta harbors a unique microbiome. Sci. Transl. Med. 6, 237ra65 (2014).
PubMed PubMed Central Google Scholar
Parnell, L. A. et al. Term normal pregnancyからの胎盤の微生物コミュニティは、空間的に変化するプロファイルを示す。Sci Rep. 7, 11200 (2017).
記事 PubMed PubMed Central Google Scholar
Seferovic, M. D. et al. 羊膜内感染のない期産・早産胎盤における16S in situ hybridizationによる微生物の可視化。Am. J. Obstet. Gynecol. 221, 146.e1-146.e23 (2019).
記事CAS PubMed Google Scholar
de Goffau, M. C. et al. Human placenta has no microbiome but can contain potential pathogens. Nature 572, 329-334 (2019).
記事 PubMed PubMed Central Google Scholar
Leiby, J. S. et al. 早産と期産のサンプルでヒト胎盤のマイクロバイオームが検出されない。Microbiome 6, 196 (2018).
記事 PubMed PubMed Central Google Scholar
Kuperman, A. A. et al. 複数の胎盤の深い微生物分析では、胎盤マイクロバイオームの証拠はない。BJOG 127, 159-169 (2020).
論文CAS PubMed Google Scholar
Sinha, R., Abnet, C. C., White, O., Knight, R. & Huttenhower, C. The microbiome quality control project: baseline study design and future directions. Genome Biol. 16, 276 (2015).
論文 PubMed PubMed Central Google Scholar
Edmonds, K. & Williams, L. The role of the negative control in microbiome analyses. FASEB J. 31, 940.3 (2017).
グーグル・スカラー
Schierwagen, R. et al. Trust is good, control is better: Technical Considerations in blood microbiome analysis. Gut 69, 1362-1363 (2020).
記事 PubMed Google Scholar
de Goffau, M. C. et al. Recognizing the reagent microbiome. Nat Microbiol 3, 851-853 (2018).
記事 PubMed Google Scholar
van der Horst, J. et al. 臨床サンプルのマイクロバイオーム・プロファイルにおける細菌DNA汚染源としての滅菌ペーパーポイント。J. Dent. 41, 1297-1301 (2013).
記事 PubMed Google Scholar
Olomu, I. N. et al. 「kitome」と「splashome」の汚染を排除した結果、固有の胎盤マイクロバイオームが検出されない。BMC Microbiol. 20, 157 (2020).
論文CAS PubMed PubMed Central Google Scholar
Nejman, D. et al. ヒト腫瘍マイクロバイオームは腫瘍型特異的な細胞内細菌で構成されている。Science 368, 973-980 (2020).
記事CAS PubMed PubMed Central Google Scholar
Pinto-Ribeiro, I. et al. 次世代シーケンサーを用いた微生物群の特性解析のためのホルマリン固定パラフィン包埋アーカイブ胃組織の使用に関する評価. Int. J. Mol. Sci. 21, 1096 (2020).
論文CAS PubMed PubMed Central Google Scholar
Poore, G. D. et al. 血液と組織のマイクロバイオーム解析は、がん診断のアプローチを示唆している。Nature 579, 567-574 (2020).
記事CAS PubMed PubMed Central Google Scholar
Wang, J. et al. 膣内微生物叢のトランスロケーションは、子宮の健康状態の障害と保護に関与する。Nat. Commun. 12, 4191 (2021).
記事CAS PubMed PubMed Central Google Scholar
Lam, S. Y. et al. 大腸がんにおける細菌変化の検出のためのホルマリン固定パラフィン包埋(FFPE)組織標本の使用に関する技術的課題。BMC Microbiol. 21, 297 (2021).
論文CAS PubMed PubMed Central Google Scholar
Allali, I. et al. 米国とスペインのコホートから得られた腫瘍と非腫瘍の隣接組織間の腸内細菌叢の組成と機能の相違。Gut Microbes 6, 161-172 (2015).
記事 PubMed PubMed Central Google Scholar
Marotz, C. et al. SARS-CoV-2の検出状況は、患者および病院環境における細菌群集組成と関連する。Microbiome 9, 132 (2021).
記事CAS PubMed PubMed Central Google Scholar
Richardson, M., Gottel, N., Gilbert, J. A. & Lax, S. Microbial similarity between students in a common dormitory environment reveals the forensic potential of individual microbial signatures. mBio 10, e01054-19 (2019).
記事 PubMed PubMed Central Google Scholar
Chen, Q.-L. et al. Rare microbial taxa as the major drivers of ecosystem multifunctionality in long-term fertilized soils. 土壌生物学(Soil Biol. Biochem. 141, 107686 (2020).
記事CAS Googleスカラー
Smirnova, E., Huzurbazar, S. & Jafari, F. PERFect: マイクロバイオームデータのためのPERmutation Filtering test。Biostatistics 20, 615-631 (2019).
記事 PubMed Google Scholar
Davis, N. M., Proctor, D. M., Holmes, S. P., Relman, D. A. & Callahan, B. J. マーカー遺伝子およびメタゲノミクスデータにおける汚染配列の簡単な統計的識別および除去。Microbiome 6, 226 (2018).
記事 PubMed PubMed Central Google Scholar
McKnight, D. T. et al. microDecon: a highly accurate read-subtraction tool for the post-sequencing removal of contamination in metabarcoding studies. エンバイロメント。dna 1, 14-25 (2019).
記事 Google Scholar
Shenhav, L. et al. FEAST: Fast expectation-maximization for microbial source tracking. Nat. Methods 16, 627-632 (2019).
記事CAS PubMed PubMed Central Google Scholar
Knights, D. et al. Bayesian community-wide culture-independent microbial source tracking. Nat. Methods 8, 761-763 (2011).
論文CAS PubMed PubMed Central Google Scholar
Minich, J. J. et al. マイクロバイオーム研究におけるwell-to-well汚染の定量化と理解. mSystems 4, e00186-19 (2019).
記事 PubMed PubMed Central Google Scholar
Lou, Y. C. et al. Using strain-resolved analysis to identify contamination in metagenomics data. Preprint at bioRxiv https://doi.org/10.1101/2022.01.16.476537 (2022).
An, U. et al. STENSL: Microbial Source Tracking with ENvironment SeLection. mSystems 7, e0099521 (2022).
記事 PubMed Google Scholar
Bolyen, E. et al. QIIME 2を用いた再現性、対話性、拡張性のあるマイクロバイオームデータサイエンス. Nat. Biotechnol. 37, 852-857 (2019).
記事CAS PubMed PubMed Central Google Scholar
Karstens, L. et al. Controlling for contaminants in low-biomass 16S rRNA gene sequencing experiments. mSystems 4, e00290-19 (2019).
記事 PubMed PubMed Central Google Scholar
Flores, R. et al. Collection media and delayed freezing effects on microbial composition of human stool. Microbiome 3, 33 (2015).
記事 PubMed PubMed Central Google Scholar(パブメド パブメド セントラル グーグル スカラー
Adams, R. I., Bateman, A. C., Bik, H. M. & Meadow, J. F. Microbiota of the indoor environment: a meta-analysis. Microbiome 3, 49 (2015).
記事 PubMed PubMed Central Google Scholar
Lou, Y. C. et al. 幼児腸内菌株の持続性は、母体由来、系統、および表面付着や鉄獲得などの形質と関連している。セルレップメッド。2, 100393 (2021).
記事CAS PubMed PubMed Central Google Scholar
Hornung, B. V. H., Zwittink, R. D. & Kuijper, E. J. マイクロバイオーム研究における問題点と現在の管理基準. FEMS Microbiol. Ecol. 95, fiz045 (2019).
記事CAS PubMed PubMed Central Google Scholar
ゴンザレス、A.ら。Qiita: 迅速でウェブ対応のマイクロバイオームメタ解析。Nat. Methods 15, 796-798 (2018).
記事CAS PubMed PubMed Central Google Scholar
Minich, J. J. et al. Host biology, ecology and the environment influence microbial biomass and diversity in 101 marine fish species. Nat. Commun. 13, 6978 (2022).
論文CAS PubMed PubMed Central Google Scholar
Shaffer, J. P. et al. 地球のマイクロバイオームの標準的なマルチオミクスにより、微生物と代謝物の多様性が明らかになった。Nat Microbiol. 7, 2128-2150 (2022).
論文CAS PubMed PubMed Central Google Scholar
Chase, J. et al. Geography and location are the primary drivers of office microbiome composition. mSystems 1, e00022-16 (2016).
記事 PubMed PubMed Central Google Scholar
Ramirez, K. S. et al. ニューヨーク市のセントラルパークにおける地中多様性の生物地理学的パターンは、世界的に観察されるものと類似している。Proc. Biol. Sci. 281, 20141988 (2014).
PubMed PubMed Central Google Scholar
Hanes, D. et al. ポテト、バナナ、アップル繊維からのレジスタントスターチブレンドの胃腸とマイクロバイオームへの影響:スマートキャップを使用したランダム化臨床試験. Front. Nutr.9, 987216 (2022).
記事 PubMed PubMed Central Google Scholar
Shaffer, J. P. et al. A comparison of DNA/RNA extraction protocols for high-throughput sequencing of microbial communities. Biotechniques 70, 149-159 (2021).
記事CAS PubMed PubMed Central Google Scholar
Ruiz-Calderon, J. F. et al. Walls talk: Microbial biogeography of homes spanning urbanization. Sci. Adv. 2, e1501061 (2016).
記事 PubMed PubMed Central Google Scholar
Robin, X. et al. pROC: an open-source package for R and S to analyze and compare ROC curves. BMC Bioinformatics 12, 77 (2011).
論文 PubMed PubMed Central Google Scholar
DADA2:イルミナアンプリコンデータからの高解像度サンプル推論。Nat. Methods 13, 581-583 (2016).
記事CAS PubMed PubMed Central Google Scholar
Annavajhala, M. K. et al. 抗レトロウイルス療法を受けるHIV患者における口腔および腸内微生物の多様性と免疫調節. mSphere 5, e00798-19 (2020).
記事 PubMed PubMed Central Google Scholar
女性性器における16Sベースの微生物相研究において、有効な超可変領域の選択は極めて重要である。Sci. Rep. 8, 9678 (2018).
記事 PubMed PubMed Central Google Scholar
Herlemann, D. P. et al. バルト海の2000km塩分濃度勾配に沿った細菌群集の変遷. ISME J. 5, 1571-1579 (2011).
論文CAS PubMed PubMed Central Google Scholar
RNA-seqリードカウントの精度重み付けを解除した線形モデル解析ツール「voom」。Genome Biol. 15, R29 (2014).
記事 PubMed PubMed Central Google Scholar
Austin, G. I. et al. ヒト由来サンプルを用いたコンタミネーションベンチマーク。NCBI https://www.ncbi.nlm.nih.gov/bioproject/PRJNA905430 (2022).
Austin, G. I., Shenhav, L. & Korem, T. SCRuB. GitHuB https://github.com/Shenhav-and-Korem-labs/SCRuB (2023)。
Friedman、J.、Hastie、T.およびTibshirani、R.座標降下による一般化線形モデルの正規化パス。J. Stat. Softw. 33, 1-22 (2010).
記事 PubMed PubMed Central Google Scholar
SCRuBを用いた汚染源モデリングにより、マイクロバイオームデータから癌の表現型を予測することが可能になった。Code Ocean https://doi.org/10.24433/CO.2307706.v1 (2023).
Wickham, H. et al. Welcome to the tidyverse. J. Open Source Softw. 4, 1686 (2019).
記事 Google Scholar
Chen, T. & Guestrin, C. XGBoost: a scalable tree boosting system. In Proc. 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (eds Krishnapuram, B. et al.) 785-794 (ACM, 2016).
参考文献のダウンロード
謝辞(Acknowledgements
Koremグループのメンバーの有益な議論に感謝する。また、G. D. Poore、C. Martino、R. Knight、R. Straussman、I. Livyatanには、彼らの研究からのデータの分析と解釈を支援していただき、R. StraussmanとI. Livyatanには論文に対する有用なコメントをいただきました。総じて、本研究で使用したすべてのデータの生成に関わったすべての著者と参加者に感謝する。本研究は、ロックフェラー大学物理学・生物学研究センター(L.S.)、コロンビア大学数理ゲノミクスプログラム(T.K.)、CIFAR Azrieli Global Scholarship in the Humans & the Microbiome Program (T.K.), R01HD106017 (T.K.) and R01CA245894 (A.-C.U.) によって支援されています。
著者情報
著者ノート
これらの著者は同等に貢献した: Liat Shenhav, Tal Korem.
著者と所属
コロンビア大学コンピュータサイエンス学部(米国ニューヨーク州ニューヨーク市
ジョージ・I・オースティン&イティック・ペアー
コロンビア大学アービングメディカルセンターシステム生物学部数理ゲノムプログラム(米国ニューヨーク州ニューヨーク
ジョージ・I・オースティン、ヨリ・メイダン、イティク・ペーア、タル・コレム
コロンビア大学アービングメディカルセンター感染症部門(米国ニューヨーク州ニューヨーク市
ヒークク・パーク、ドウェイン・シーラム、アンヌ・カトリン・ウーレマン
コロンビア大学アービングメディカルセンター皮膚科(米国・ニューヨーク州・ニューヨーク市
タニヤ・セジン&アンジェラ・M・クリスティアーノ
カリフォルニア大学バークレー校 植物・微生物生物学部(米国
ユエ・クレア・ルー
米国ペンシルベニア州ピッツバーグ大学医学部 外科学教室
ブライアン・A・ファイアック&マイケル・J・モロウィッツ
米国・カリフォルニア大学バークレー校地球惑星科学科
ジリアン F. バンフィールド
米国カリフォルニア大学バークレー校環境科学・政策・管理学部
ジリアン F. バンフィールド(Jillian F. Banfield
イノベーティブゲノミクス研究所(米国カリフォルニア州バークレー、カリフォルニア大学
ジリアン F. バンフィールド
チャン・ザッカーバーグ・バイオハブ(米国・カリフォルニア州・サンフランシスコ
ジリアン F. バンフィールド(Jillian F. Banfield
コロンビア大学アービングメディカルセンター遺伝学・発達学科(米国・ニューヨーク州ニューヨーク市
アンジェラ M. クリスティアーノ
コロンビア大学データサイエンスインスティテュート(米国ニューヨーク州ニューヨーク市
イティック・ペアー
ロックフェラー大学物理学生物学研究センター(米国ニューヨーク州ニューヨーク市
ライアット・シェンハブ
コロンビア大学アービングメディカルセンター産科婦人科(米国ニューヨーク州ニューヨーク市
タル・コレム
CIFAR Azrieli Global Scholarsプログラム、CIFAR、カナダ、トロント
タル・コレム
寄稿文
G.I.A.は、SCRuBを執筆し、すべての計算機解析を設計し実施した。H.K.はすべての実験の設計と実施を行った。Y.M.は解析に協力した。D.S.は、実験に貢献した。T.S.はサンプルを収集した。A.M.C.はサンプル採取を監督した。A.-C.Uはすべての実験を監督した。Y.C.L、B.F、M.M、J.F.Bは、研究のデータの入手、分析、解釈を支援した。L.S.とT.K.は、研究の構想と設計、分析の設計、研究の共同監修を行い、この研究に等しく貢献した。G.I.A.、I.P.、L.S.、T.K.は結果を解釈し、論文を執筆した。
対応する著者
Liat ShenhavまたはTal Koremに連絡する。
倫理的宣言
競合する利益
A.-C.U.は、本研究とは無関係に、メルク社から研究資金を受けている。他の著者は、競合する利害関係はないことを宣言している。
査読
査読情報
Nature Biotechnologyは、本著作の査読に貢献した匿名査読者に感謝します。
追加情報
出版社からのコメント Springer Natureは、出版された地図や所属機関の管轄権の主張に関して、中立を保っています。
エクステンドデータ
Extended Data 図1 Nejman et al.18のデータにおける音源追跡仮説の実証的検証。
汚染の文脈におけるソーストラッキング仮説30,31,34は、汚染源に一緒に存在する分類群は、汚染源と同様の割合で、他のサンプルにも一緒に導入されると規定しています。a, Netherlands Cancer Instituteのサンプルにおける各ASVの平均相対存在量(y軸)を、SCRuBの予測(汚染パラメータp>0.5およびp≤0.5)に基づいて「高」汚染と「低」汚染に分け、同じバッチからの陰性コントロールにおける同じASVの存在量(x軸; Nejmanら18の「No Template Controls」)に対してプロットしたものです。汚染源追跡の仮定と一致して、汚染源に一緒に存在する分類群は、サンプルに一緒に、そして同様の割合で導入され、その結果、サンプルとコントロール間で共有されている分類群の相対存在量の間に明確な正の相関が生じた(それぞれ高汚染と低汚染についてピアソンR = 0.99, P < 10-20 とR = 0.082, P = 0.037 )。予想通り、この相関はSCRuBが予測したサンプルの汚染度によって変化する。高汚染と予測されたサンプル(青)は0.97の傾き、低汚染と予測されたサンプルは0.057の傾きを持つ。 b,c, 最高(b)、最低(c)の汚染度と予測されたサンプルについては(a)と同じ。Pearson Rは、共有分類群が3つ以上あるパネルについて表示されている。高濃度汚染サンプルでは相関が非常に高かった(Pearson R > 0.9, P < 10-4 for all)。
Extended Data 図2 シミュレーションのフレームワークの説明。
異なる除染方法のベンチマークに使用したシミュレーションフレームワークの可視化。a.88~94個のサンプル、2、4、8個のコントロール、および目的のサンプルとは生物学的に異なると仮定した無関係な研究からの汚染源からなるデータセットを生成します。コントロールにはウェル間リークを、対象サンプルには共有ソースからのコンタミネーションを加えます(Methods)。汚染除去されたデータセットは、Jensen-Shannon divergenceを使用して、グランドトゥルースの非汚染分類学的組成に対して評価される。
Extended Data Fig. 3 SCRuBは、多様な環境とデータタイプのインシリコシミュレーションにおいて、代替の除染方法を凌駕しています。
a-l,図1と同じ。図1c, dと同じだが、熱帯海底堆積物の16Sアンプリコンシークエンス(Qiita41 study ID 11922; a,b)、南カリフォルニアの魚42の複数の体の16Sアンプリコンシークエンス(c,d)のデータに基づくシミュレーションを行う; Earth Microbiome Projectの土壌の16Sアンプリコンシーケンス43(e,f)、オフィスサンプルのITSシーケンス44(g,h)、ニューヨークのセントラルパークの土壌の18Sアンプリコンシーケンス45(i,j)、ヒト腸のメタゲノムシーケンス46(k,l)。パネルごとにN = 120のシミュレーションを行った。ほぼすべてのシミュレーションシナリオと環境において、SCRuBは代替の除染アプローチを凌駕しています。ボックスラインは中央値、ボックスはIQR、ウィスカーは1.5IQR、はSCRuBと標識法の比較で片側Wilcoxon signed-rank P < 10-4 (正確なP値は補足表1参照)。
拡張データ 図4 SCRuBは評価指標とシミュレーションパラメータに頑健である。
a-d、図1c、dと同じ、箱と群プロット(線は中央値、箱はIQR、ひげは1.5IQR)各実験のグランドトゥルースとその除染出力間のJensen-Shannon divergence(JSD)の平均(a、b)および標準偏差(c、d)を示す。e,fは図1c,dと同様であるが、コントロールはランダムではなくプレートの端に沿って配置されている。図1c,dと同様に、SCRuBは、除染なしと50%のウェル間リークレベルのmicroDeconを除くすべてのパラメータで代替法を上回った。 g, 図1dのウェル間リークレベル5%の結果を、コントロール数で層別して示した(N = 10実験/セット)。SCRuBは、コントロールの数に関係なく、代替の除染方法よりも優れています(片側Wilcoxon signed-rank P < 10-3 for all, P = 0.0029 vs. microDecon with one control)。 h, 図1dと同じで、サンプルロケーションなしで、したがってウェル間の漏れを考慮せずにSCRuBを実行した結果も示します。すべてのシミュレーションで、SCRuBはサンプルロケーションなしのSCRuBを上回ったが(すべてでP < 10-4)、サンプルロケーションなしのSCRuBは、多くの設定で代替の除染方法を上回ったままである。は、SCRuB(パネルa-g)およびサンプルロケーションなしのSCRuB(パネルh)と印のついた方法の比較のための片側ウィルコクソン符号付きランクP < 10-3(パネルg)P < 10-4(その他)(正確なP値については補足表1を参照)です。マークした方法の方が性能が良い場合はが下になる。
Extended Data Fig. 5 SCRuBはシーケンスの深さに頑健である。
a,すべてのサンプルのリード数を1,000、5,000、10,000、25,000リードのいずれかに設定し、汚染とウェル間リークレベルを5%に設定した実験の比較です。1,000リードの深さを除いて、SCRuBはすべてのシミュレーションで代替法を上回った(片側Wilcoxon signed-rank P < 10-3、すべて)。1,000リードの深さでは、SCRuBはdecontamと同等の性能を持ち(P = 0.19)、それ以外を有意に上回った(すべてP < 0.01)b, 各実験で、平均リード深度を10,000、標準偏差を2,500、汚染とウェル間リークのレベルを5%に設定しました。各サンプルの読み取り深度が属する実験内の分位数に基づいて、各実験のサンプルをQ1〜Q4の4つのグループに分けた。すべてのグループにおいて、SCRuBは代替の除染方法を上回り(すべてにおいてP < 10-3)、SCRuBは読み取り深度が異なる実験でも一貫した性能を持つことが示された。 c, 平均読み取り深度10,000、標準偏差0、500、2500、7500、汚染およびウェル間漏洩レベル~5%の実験結果。すべての標準偏差において、SCRuBは競合手法を上回り、実験間のリードカバレッジの変動に対してロバストであることが実証されました。箱線は中央値、箱はIQR、箱ひげは1.5IQR、はSCRuBと標識法の比較で片側Wilcoxon signed-rank P < 0.01 (exact P valuesは補足表1参照)。
Extended Data Fig. 6 SCRuBは無関係な対照を正しく処理する。
a,各除染法で除去された分類群(観察データでは総和が0より大きく、除染データでは総和が0となる分類群として定義)を示すベン図。SCRuBはmicroDeconやdecontamよりも除去された分類子が少なく、SCRuBで除去された分類子の大部分はmicroDeconやdecontam(LB)でも除去されていた。 b, Box and swarm plot(線は中央値、箱はIQR、ひげは1. 5IQR)は、88サンプルと8つの陰性コントロールからなる50のシミュレーションデータセットにおいて、無関係なコントロール(Methods)による除染前後のシミュレーションサンプル間のシミュレーションごとのJensen-Shannonダイバージェンスの中央値を示しています。SCRuBは非情報的なコントロールに強く、オリジナルに非常に近い分類学的組成を生成し、代替方法よりも有意に近い(SCRuBとmicroDecon、decontam、decontam(LB)間でそれぞれ、片側ウィルコクソン署名順位P = 4×10-10, P = 8.8×10-10, P = 3.8×10-10).
拡張データ 図7 SCRuBはウェルからウェルへの漏れを正しく考慮する。
a,図2fと同様に、Minichら31の実験デザイン(Methods)で定義された真実の分類学的組成と、未処理のデータセット('No decontamination')または様々な方法で除染したデータセットの分類学的組成(x軸)とのJensen-Shannon発散(y軸)を示し、31種類の低有病率(左)および90種類の高頻度(右)のモノカルチャーについて別々に表示。低有病率サンプルでは、SCRuBはmicroDecon、decontam、decontam (LB)、制限的アプローチと比較して、グランドトゥルースに有意に近い推定値を示した(すべてのケースで片側Wilcoxon P < 10-4)。高有病率サンプルでは、SCRuBはdecontamおよびmicroDeconと同等の性能(それぞれP = 0.93, P = 0.12)、除染なし、制限的、decontam(LB)を上回った(それぞれP = 10-8, P = 8.7×10-17, P = 1.3×10-4)。 b-f, 各分類群を一つではなく二つのモノカルチャーに置いたより複雑なウェル間漏洩実験のシミュレーションである。このようなシナリオをシミュレートするために、ランダムに分類群のペアを選び、実験を通して一方の分類群に割り当てられたすべてのリードを、もう一方の「焦点」となる分類群に割り当て直しました。例えば、Minichらは大腸菌をウェルC10に配置し(c)、ウェル間のリーク(d)を発生させた。そこで、Corynbacterium属を含むウェルC3をランダムに選択し、すべてのCorynbacteriumリードをE. coliに再割り当てしました(e)。このシミュレーションデータに対してSCRuBを実行し、元のウェルにおける大腸菌の相対的な存在量を評価した(b, f)。これを100回行い、元のウェルにおける焦点となる分類群の相対的な存在量を調べました(b)。すべてのケースで、SCRuBはこのより複雑なシナリオにおけるウェル間リークを正確に処理し、焦点となるモノカルチャーに属する分類群の除去を回避しました。
Extended Data Fig. 8 幼児と母親のマイクロバイオームのメタゲノム研究において、SCRuBはネガティブコントロールへのウェル間リークを正しく推論する。
a,Louら33,39が使用したプレートデザインで、各抽出プレートの隅にネガティブコントロールを配置したものです。株レベル解析により、Louらは特定の陰性対照へのwell-to-wellリークを特定した。 b, 各サンプルのMAG存在量(Methods)を用いて各プレートでSCRuBを実行すると、陰性対照を含む4枚のプレートのうち2枚で陰性対照へのwell-to-wellリークが確認できた。 c, SCRuBのwell-to-wellリークの予測はLouらの株レベル解析結果に基づく評価と一致した。(Methods).
Extended Data Fig. 9 DNA抽出時のウェル間リークはより顕著である。
a,b, 実験2(図3a)のDNA抽出(a)およびライブラリー作成(b)時のプレートレイアウト。10個のコントロールがDNA抽出ステージに含まれ(三角形)、さらに7個のコントロールがライブラリー調製ステージに含まれた(六角形);それぞれのペアは他のサンプルから離れていた(「遠いサンプル」、紫)。 5*IQR)は、DNA抽出およびライブラリー調製コントロールに隣接するヒト由来サンプルと、各処理段階の様々なコントロールとの間のJensen-Shannon発散(y軸)を、隣接コントロールおよび近コントロール(a,bの紫)で層別し、除染を行わない「生の」分類組成から計算して示した。サンプルは遠方コントロールよりも近傍コントロールに類似しており、DNA抽出とライブラリー調製の両方で発生するウェル間リークを実証しています。サンプルは、近傍のライブラリーコントロールよりも近傍の抽出コントロールに類似しており、DNA抽出時にウェル間のリークがより顕著であることが示唆される。P、両側Mann-Whitney U、N、関連サンプル間のペアワイズ距離の数。
Extended Data Fig. 10 SCRuBは、メラノーマと治療効果の予測を改善する。
a-f、肺がん、前立腺がん、メラノーマ、およびコントロールの患者からのデータについて、Pooreら20のデータを用いて勾配ブースト決定木のペアごとの分類精度を評価したROC(Receiver Operating Characteristic)曲線。代替除染方法と比較して、SCRuBでは同等または向上する分類精度、すべてのケースで元の解析と比較して精度が向上しています。方法間を比較したP値については、補足表1を参照。g、Nejmanら18名の腫瘍マイクロバイオームデータに適用した各除染方法によって完全に除去された分類群の数を列挙したベン図。SCRuBは代替方法よりも除去した分類群が少なかった。
補足情報
補足情報
補足説明
報告書の概要
補足的な表
補足表1:図に表示されている正確なP値。補足表2:実施した実験のメタデータとプレートレイアウト。図3に記載された実験を指す。補足表3:コントロールサンプルのV1-V2リード数。ヒト由来サンプルを用いた実験(図3a;Methods)の各サンプルで見つかったV1-V2領域からのリードの数。NAを持つサンプルは、DADA2処理後のリードがなかった。
権利と許諾
Springer Natureまたはそのライセンサー(学会やその他のパートナーなど)は、著者またはその他の権利者との出版契約に基づき、本論文の独占的権利を保有しています。本論文の受理された原稿バージョンの著者のセルフアーカイブは、かかる出版契約の条件および適用法のみによって管理されます。
転載と許可
この記事について
この記事を引用する
Austin, G.I., Park, H., Meydan, Y. et al. Contamination source modeling with SCRuB improves cancer phenotype prediction from microbiome data. Nat Biotechnol (2023). https://doi.org/10.1038/s41587-023-01696-w
引用文献のダウンロード
2022年5月17日受領
2023年1月23日受理
2023年3月16日発行
DOIhttps://doi.org/10.1038/s41587-023-01696-w
対象分野
微生物群集
計算生物学・バイオインフォマティクス
統計的手法
ネイチャーバイオテクノロジー(Nat Biotechnol) ISSN 1546-1696(オンライン) ISSN 1087-0156(プリント)。
nature.comサイトマップ
Natureポートフォリオについて
弊社について
プレスリリース
プレスオフィス
お問い合わせ
コンテンツ紹介
ジャーナルA-Z
テーマ別記事
ナノ
プロトコル交換
ネイチャーインデックス
出版ポリシー
Natureポートフォリオポリシー
オープンアクセス
著者・研究者向けサービス
リプリント&パーミッション
研究データ
言語編集
科学編集
ネイチャーマスタークラス
エキスパートトレーナー主導のライブワークショップ
リサーチソリューション
図書館・機関
ライブラリアンサービス&ツール
図書館ポータル
研究を公開する
図書館への推薦
広告とパートナーシップ
広告宣伝
パートナーシップとサービス
メディアキット
ブランデッドコンテンツ
キャリア開発
ネイチャーキャリア
ネイチャーコンファレンス
ネイチャーイベント
地域別ウェブサイト
ネイチャー アフリカ
ネイチャーチャイナ
ネイチャーインディア
ネイチャー・イタリア
ネイチャージャパン
ネイチャーコリア
ネイチャー・ミドルイースト
個人情報保護方針

Cookieの使用

プライバシーポリシー/Cookieの管理
法的通知

アクセシビリティに関する声明

ご利用条件

アメリカ合衆国のプライバシー権
© 2023 シュプリンガー・ネイチャー・リミテッド

この記事が気に入ったらサポートをしてみませんか?