メタデータベースのソースアノテーションを用いた非標的メタボロミクスの強化

本文へスキップ
ネイチャーバイオテクノロジー
検索
ログイン
コンテンツ
Natureについて
掲載
短信
PDFダウンロード
ブリーフ・コミュニケーション
公開日: 2022年7月7日
メタデータベースのソースアノテーションを用いた非標的メタボロミクスの強化

https://www.nature.com/articles/s41587-022-01368-1

Julia M. Gauglitz, Kiana A. West, ...Pieter C. Dorrestein 著者一覧を見る
Nature Biotechnology 40巻 1774-1779ページ (2022)この記事を引用する

18kアクセス

22件の引用

308 Altmetric

メトリクス詳細

この記事の著者訂正が2023年10月18日に掲載されました。

この記事は更新されました

要旨
ヒトの非標的メタボロミクス研究では、分子特徴の10%程度しかアノテーションされていない。メタボロミクスのタンデム質量分析(MS/MS)データとメタデータアノテーションされたソースデータを擬似MS/MSリファレンスライブラリとして照合するリファレンスデータ駆動分析を紹介する。このアプローチを食品ソースデータに適用することで、従来の構造MS/MSライブラリのマッチングよりもMS/MSスペクトルの使用率が5.1倍向上し、未対象データから食事パターンを経験的に評価できることを示す。

類似のコンテンツが他のユーザーによって閲覧されている
FoodMASST 食品および飲料の質量分析検索ツール
論文オープンアクセス 20 April 2022
Kiana A. West, Robin Schmid, ... Pieter C. Dorrestein

ReDU:公開質量分析データの検索と再分析のためのフレームワーク
論文 2020年8月17日
Alan K. Jarmusch, Mingxun Wang, ... Pieter C. Dorrestein

スペクトルライブラリにない代謝物の高信頼構造アノテーション
論文オープンアクセス 2021年10月14日
Martin A. Hoffmann, Louis-Félix Nothias, ... Sebastian Böcker

主な内容
メタゲノム(用語の定義についてはBox 1を参照)またはメタトランスクリプトーム実験から得られた複雑な配列データの解釈には、キュレーションされた遺伝子のデータベースと、メタデータ(発生段階、組織位置、表現型など)が注意深くキュレーションされた全ゲノムやその他の配列データなどの参照データの両方が必要である1,2,3,4。このようなリファレンスデータ駆動型(RDD)解析は、既知および未知の遺伝子や転写産物間のマッチングを利用することにより、複雑な生物群集の理解を深める。RDD戦略は、ほとんどのメタトランスクリプトミクスやメタゲノミクスデータの解析を成功させるために不可欠である。類似の例として、液体クロマトグラフィー-タンデム質量分析計(LC-MS/MS)ベースのアンターゲットメタボロミクスデータの解釈は、構造MS/MSライブラリを検索することによって実行されます。しかし、アンターゲティングMS/MSベースのメタボロミクスから得られる知見を向上させるために、キュレーションされ構造化された制御語彙メタデータを持つ参照データを活用することはまだ行われていません。

RDD解析では、アノテーションされたMS/MSスペクトルだけでなく、アノテーションされていないスペクトルもすべて使用します。ガスクロマトグラフィー質量分析(GC-MS)BinBaseリソースは、RDDの方向に一歩を踏み出しました。BinBaseを使用すると、非公開のGC-MSデータセットでスペクトルの一致が観察された場合に注釈を付けることができる。しかし、メタデータは十分に管理されておらず、文脈に応じたメタデータを追加する機能を欠いている5,6。さらに、構造的アノテーションを使用することで、文献マイニング7によって出典を特定できることは、以前に実証済みである。しかし、上記のような制限や、代謝の場合、関連スペクトルをリンクすることができないため、未知の情報にアノテーションを付与する上記の戦略は、データセットレベルでソース情報を解釈するために体系的に使用することはできない。そこで、メタボロミクスのためのRDDアプローチを紹介し(図1)、その後、未標的のヒトデータから得られた経験的な食品リードアウトを示すユースケースを示します(図2)。

図1:RDDベースの解析ワークフローの概念。
図1
a, ヒト生物資源保管施設から得られたMS/MSベースの非標的メタボロミクスデータと、メタデータの制御語彙を持つ参照サンプルのデータのスペクトルアライメントを実行する。b, スペクトルの一致を参照サンプルのメタデータからソース情報にリンクする。データサイエンスと解釈を可能にするために、ソースオントロジー、ヒト生物試料、カウントのデータテーブルを作成する。

フルサイズ画像
図2: 食品参照データを含むRDD。
図2
a, 食品RDD解析スキーマ。(int. = 強度) b, 参加者の食事をコントロールした睡眠制限および概日リズムのズレに関する研究から血漿中に観察された食品スペクトルカウント(1% FDR21)(健康な成人20人からの n = 371 サンプル)18。ノードの大きさは、各食品レベルでのスペクトル一致の相対数を表す。c,イタリアの百寿者データと米国の睡眠および概日リズム研究とのクロスオーバー実験(糞便および血漿サンプルの両方)。これらの個人が摂取した研究地域特異的食品(あり)対別の研究地域特異的食品セット(なし)。一元配置ウェルチのt検定、太線は平均値、枠内の範囲は25分位から75分位までの四分位範囲(IQR)、ひげは最小値と最大値を示す。d, ビーガン(茶色)と雑食データ(緑色)で色分けした食品数のPCA。e, オントロジーのレベル 3 における食品カウントの、雑食動物と菜食主義者のデータとの関連における統計分析(左の 6 つのパネル、乳製品、肉類、魚介類、豆類、果肉類、野菜、ウィルコクソン検定、n = 36、19 は菜食主義者、19 は雑食主義者)。 f, e と同様であるが、固有のスペクトルカウントを使用したレベル 4 オントロジー(スペクトル使用率は、分析に使用した MS/MS スペクトルのパーセンテージである。これらは、マイクロバイオーム科学における微生物の系統学で見られるような無名オントロジー(例えば、王国、属、種)であるため、これらをレイヤーと表記した(右6パネル、牛、豚、魚-塩水、貝類、柑橘類、野菜、補足表1)。e,f,ボックスはIQR、下限は25パーセンタイル、中央線は中央値、上限は75パーセンタイル、バーは75パーセンタイル+1.5×IQR、25パーセンタイル-1.5×IQRを示す。

フルサイズ画像
非標的MS/MSベースのメタボロミクス実験では、1970年代後半からMS/MS構造ライブラリーを検索しています8,9。RDD メタボロミクスでは、単一の MS/MS スペクトルのみを利用してアノテーションを取得するのではなく、数百から数千の MS/MS スペクトルを含むアンターゲットメタボロミクスファイルのすべての MS/MS スペクトルを使用して、メタデータベースのソースアノテーションを行います。主な違いは、ソース参照データセットからコンテキスト化された情報が出力されることです。RDD解析を成功させるためには、コンテキスト化されたデータが制御された語彙を用いてキュレーションされていることが重要である。今回発表したRDDのアプリケーションでは、ヒト生物試料から取得したデータから、どのような食品成分を復元できるかを調べた。この疑問に答えるには、参照食品のMS/MSソースデータと関連するキュレーションされたメタデータのリソースが必要であった。ソースデータには、既知および未知の分子、同位体、付加体、ソース内フラグメント、多量体の複数のイオン形態のMS/MSスペクトルが含まれる11,12。RDDは、MS/MSスペクトルの直接マッチングまたは分子ネットワーキングによって、ヒト生物資源保管施設の標準データセットと一致させることができる。静的ライブラリとは異なり、RDD解析ではファイルやメタデータをカスタムで追加できるため柔軟性が保たれ、参照データの処理方法をユーザーが制御できる。Global Natural Products Social Molecular Networking(GNPS)を使用したRDD解析のステップバイステップのチュートリアルを作成しました(https://ccms-ucsd.github.io/GNPSDocumentation/tutorials/rdd/、対応するビデオチュートリアルhttps://www.youtube.com/watch?v=2-XsifrUY0Y)13。

RDD メタボロミクスを例示するため、また食品は健康にとって重要であるため、食品メタボロミクスリファレンスデータセットを作成しました。ヒトのメタボロミクスデータから食品と飲料の情報をレトロスペクティブかつ経験的に読み出すという、満たされていないニーズがあります。これは、最大150~200の代謝物を対象とした現在の最先端の質量分析栄養読み出しアプローチ、食物摂取頻度および摂取量のアンケート、食事記録、24時間リコール(自己監視または栄養専門家による支援)を補完するものです14,15。食品参照データセットは、非標的メタボロミクスと~3,500食品(157の食品固有のメタデータフィールド、補足表1)の詳細かつ構造化されたメタデータで構成されている。このデータセットには、1,907,765 スペクトルからマージされた 107,968 個の固有の MS/MS スペクトルが含まれています。食品ソースデータは、GNPS/MassIVE に追加のデータセットとメタデータを作成および登録することで、容易に拡張することができる。

RDD のために、食品ソースデータはヒトのメタボロミクスデータセットと共に GNPS ベースの分子ネットワーキング16,17 に供される(図 2a)。睡眠および概日研究の参加者の管理された研究用食事に関する情報を使用して、RDDが消費されたことが分かっている食品を回収するかどうかを評価した18。この研究では、参加者は4日間、2回にわたって収容され、管理された食事が与えられていたため、その研究による既知の食事と結果が一致するかどうかがわかった(図2b)。15種類の食品カテゴリーのうち、11種類が参加者に提供された食品と直接一致した。そのうち3つは、ブドウの代わりに発酵ブドウ、リンゴの代わりにアップルサイダー、牛乳の代わりにヨーグルトなど、消費された非発酵食品の発酵バージョンと一致した。カフェイン入り飲料を摂取した形跡が観察されたのは、最初の48時間に1人、試験中盤に2人目に1回だけで、カフェイン入り飲料と一致するものがほとんどなかったことは、管理食でカフェイン入り飲料を摂取しなかったことと一致している。パッケージの成分表には必ずしも記載されていないが、ローズマリーは酸化や腐敗を遅らせるためにひき肉に添加される一般的な成分である。ソーダとのマッチの出所は不明である。このことから、RDDは非標的メタボロミクスデータから正しい食事情報を取得することに成功しただけでなく、管理食研究における食事順守のモニタリングにも使用できることが実証された。

また、米国またはイタリアの食品(異なる食事)と臨床コホートをクロスマッチングさせて、不一致の食品インベントリをテストしました。クロスオーバーの結果、MS/MSスペクトル使用率(分析によって解釈されたMS/MSスペクトルの割合)は、正しい地域の食品を使用した場合は15~30%であったのに対し、相互テストでは5~6%であった(図2c;P = 0.019)。これらの観察結果は、RDD分析が消費される食品に基づいて選択的であることを示しているが、一般的な食品データベースにはかなりの価値があるため、食品参照データベースを増やし続けることが重要であることも示している。食品周期表イニシアティブや、MetabolightsおよびMetabolomicsワークベンチリポジトリとGNPS/MassIVEとのリンクのような取り組みは、食品参照データの拡大に役立つであろう。

次に、RDD分析でヒト生物試料抽出物にスパイクされた参照食品を回収できるかどうかを評価した。そこで、2 種類のヒト糞便サンプルまたは NIST 1950 血漿参照抽出物とトマト苗抽出物との混合物を、異なる割合で分析した19,20。3つの生物試料のすべてにおいて、トマト苗抽出物に対するスペクトル一致の割合は、スパイクインの割合に比例して直線的に増加した(P = 2.32 × 10-31;補足図1)。

RDD解析はレトロスペクティブに実施できるため、食品参照データセットと28の追加のヒト公開データセットを共同解析した(補足表2、補足図2)。MS/MSスペクトルのうち、10.1 ± 4.4%がスペクトル構造ライブラリーに一致した。RDDは、MS/MSスペクトルの使用率を、MS/MS構造ライブラリーのマッチングよりも5.1±3.3倍増加させた。分子の代謝されたバージョンを捕捉できる分子ネットワーキングにより、スペクトルデータの使用量は6.8 ± 3.5倍に増加しました。分子変換による代謝の可能性を表す連結ノードを含めると、食事の経験的読み出しとして活用できるMS/MSスペクトルの合計が43.7±3.1%(糞便;P = 6.9 × 10-10)、51.2±6.9%(血漿;P = 2.8 × 10-6)、および58.0±4.2%(その他;P = 1.4 × 10-6)増加した(補足図2)。

これらの 28 個のデータセットから RDD 解析によって得られた食品消費の読み出しを検証するために、食品ベースの RDD 解析によって作成された分子ネットワーク(1%の偽発見率(FDR)、およびメタボロミクス標準化イニシアチ ブ21,22 に従ったレベル 2/3)におけるスペクトルライブラリの直接一致を評価し、それらが食品のコンテキストで意味を持つかどうかを検証した。参照ライブラリに対する 5,455 スペクトルのうち 4,586 スペクトルについて InChIKey が利用可能であり、平面構造を考慮すると 1,492 個のユニークな構造が得られた。GNPS7,10でライフスタイルタグが関連付けられた1,492の平面構造のうち415について、「食物消費」が最も頻繁に報告されたタグであった(357エントリ、86%)。さらに、「薬物」とタグ付けされた動物の成長を促進する飼料添加物など、食品生産チェーンに関連するものも一致し ており、これには抗菌剤であるモネンシン、エニルコナゾール、カナマイシン、その他の農業添加物や環境毒素(ドモイ酸など)23 が含まれる。

RDDが食生活の嗜好を明らかにできるかどうかを評価するため、雑食者と菜食者のデータセットを分析した。参照食品とのスペクトルマッチの相対比率を主成分分析(PCA)した結果、食の嗜好の間に明確なパターンがあることが明らかになった(図2d)。雑食者は、乳製品、肉類、魚介類により多くのMS/MSが一致した(それぞれ、P = 0.0021、2.2 × 10-10、7.7 × 10-7)のに対し、菜食者は、豆類、果肉類、野菜により多くのMS/MSが一致した(それぞれ、P = 2.2×10-10、0.0096、0.029;図2e)。食品のMS/MSスペクトルの多くは重複している可能性があるため、各食品に固有のMS/MSスペクトルのみを使用することで、さらに特異性を高めることができる(図2f)。高齢者集団24を対象としたRDD分析では、食事の多様性が低い人ほど、乳製品、ソーダ、コーヒーのスペクトルが多く一致し、このような食事タイプは、認知機能が正常な人よりもアルツハイマー病のグループに多く見られた(補足図3)。これは、RDD分析が、各サンプルの食事組成の経験的な読み取りに基づいて、臨床研究をレトロスペクティブに層別化するために使用できることを示している。

このように、RDDを使用すると、食事パターン(例えば、菜食主義者と雑食主義者)や特定の食品の消費量を読み出すことができ、より一般的には、環境または微生物ソースを含むソースのキュレーションされたオントロジー対応の参照データベースとの照合に使用できます。RDDメタボロミクスは、高度にスケーラブルな分子ネットワーキングと詳細なメタデータの組み込みを必要とするため、現在のところGNPS独自のものである。しかし、他の分析エコシステムに分子ネットワーキング機能が追加されたり、RDDが他のスペクトルアライメントアルゴリズムと互換性を持つようになると、RDDメタボロミクスに他のリソースを使用できるようになります。GC-MSのスケーラブルな分子ネットワーキングも可能であるため25 、BinBase5,6 などの特殊なリソースも、いずれは特定の用途や疑問のRDD分析に活用できるようになるでしょう。RDDメタボロミクスの範囲を食品の読み出し以外にも拡大するには、パーソナルケア製品、医薬品(有効成分だけでなく製剤も含む)、微生物分離株、原産国、生物学的性別、年齢などのよく管理されたデータセットをソースリファレンスデータとして使用することもできます。RDDメタボロミクスの応用例としては、食事と栄養摂取、暴露リスク、薬の使用、違法物質の摂取、環境アレルゲン、汚染調査、マイクロバイオーム調査、食品成分/不純物、科学捜査、潜在的な暴露と健康への影響を知らせるためのパーソナルケア製品のトレーシングなどが考えられます。

方法
本研究で使用したヒトデータセットのIRB情報とGNPS/MassIVE ID
睡眠研究(MSV000083759; IRB 15-0282)、百寿者(MSV000084591; IRB 180478)、関節リウマチに対する食事の影響(MSV000084556; IRB 161474)、後期早産児(LP)(MSV000083462; MSV000083463; IRB 151713、UCSD)、医療的複雑性を有する小児(MSV000084610; IRB 161948、UCSD)、アメリカ人の腸(MSV000081981; IRB 141853、UCSD)、発酵食品の摂取(MSV000081171; IRB 141853、UCSD)、マラウイの豆類サプリメント(MSV000081486; IRB201503171、ワシントン大学ヒト研究委員会)、Rotarixワクチン反応(MSV000084218、IRB PR-10060、バージニア大学)、IBD_1(MSV000082431、IRB 150675)、IBD_individual(MSV000079115、IRB 150675)、IBD_seed(MSV000082221; UCSD HRRP 131487)、IBD_biobank(MSV000079777; UCSD HRRP 131487)、IBD_2(MSV000084775; IRB 150675)、IBD_200(MSV000084908; IRB 150675)、アルツハイマー病(MSV000085256; UCSD IRB 170957)、COVID-19(MSV000085505; MSV000085537;IRB30248420。 9.0000.5440, University of São Paulo, Brazil)、IBD_biopsy(MSV000082220; IRB 120025)、痛風(MSV000084908; IRB 160768X)、成人の唾液(MSV000083049; IRB 150275, UCSD)、マメ科植物の補給(MSV000084663; IRB 201905103)、NIST雑食およびビーガン参照データ(MSV000086989; de-identified NIST IRB MML-2019-035)。

Global FoodOmics 基準データ
RDDメタボロミクス解析のハイライトに使用する模範的データセットについては、「Global FoodOmics」プロジェクト(http://www.globalfoodomics.org)の参照データセットを作成し、活用した。このデータセットには、American GutおよびEarth Microbiome Projects26,27に続き、コミュニティから提供された3,579の食品および飲料サンプルが含まれている。サンプルの大部分は写真撮影され、サブセットは16SリボソームRNAプロファイリング(1,511サンプル)に供され、微生物組成を特徴付けるとともに、同じプライマーで照合されたミトコンドリアおよび葉緑体配列に関する情報も提供された。16SリボソームRNAアンプリコンシーケンスの生データおよび処理データはQiita study 11442で入手可能で、生シーケンスデータはEBI accession ERP122648に寄託されている。我々のGlobal FoodOmicsプロジェクトの食品は、Earth Microbiome Project Ontology、USDA Food Composition Database、Food and Nutrient Database for Dietary Studies28,29の修正版(https://ndb.nal.usda.gov/)に従ってキュレーションされ、6レベルの食品オントロジー、発酵または有機の状態、陸上または水中の原産地、原産国などの情報も含まれている。

サンプル収集
サンプリング方法は、家庭、レストラン、お祭り、研究室など、どのような環境でもサンプル採取を容易にするために開発された。初期サンプルは2017年4月から2018年3月の間に収集された。追加のサンプルセットは2019年秋まで追加された。各サンプルには、サンプリング時に固有の番号識別子が割り当てられ、サンプルの出所を追跡し、サンプルに関する記述情報を整理するために使用された。加えて、可能な場合は参加者がサンプルを撮影し、全サンプルの写真アーカイブを作成した(MassIVE MSV000084900にアップロード:サンプルの67%(2,399/3,579)に相当する4,000以上の画像)。主に初期データセットのために、これらの画像は、異なるサンプルに関する補助的な情報(メタデータと呼ばれ、以下で詳細に説明される)を収集するための最初の参照ポイントとして使用された。画像アーカイブは、メタデータの遡及的なキュレーションを可能にするために重要であった。プロジェクトが発展し、サンプルの種類が増えるにつれて、新しいカテゴリーがメタデータに追加され、それらはサンプル採取の数週間後、あるいは数ヶ月後に記入された。

サンプルは、メタデータに特に記載がない限り、サンプル採取後24時間以内に-80℃で凍結された。本試験に含まれる各食品または飲料について2検体を採取した。1検体は保存用として採取し、そのまま凍結し、2検体は抽出用に採取した。食品サンプルは、1 ml の 95%エタノール(エチルアルコール(Sigma-Aldrich)および Invitrogen UltraPure 蒸留水)をあらかじめ満たしたチューブに採取した。サンプルは 2ml 丸底微量遠心チューブ(Qiagen)に採取し、凍結前に重量を測定した。サンプル前後の重量および重量差はメタデータに記録した。サンプリングはさまざまな環境で行われ、将来のクラウドベースのコミュニティ科学への参加と整合させることを目的としているため、抽出溶媒(エタノール)の濃度を指定してすべてのサンプルを収集することはできなかった。そのため、データは定量的ではなく定性的に比較することができるが、特定のサブセットについては50mgの試料が収集された。

食品サンプルの追加セットは、可能な限り上記と同じ方法でコアセットに追加した。ベネズエラからのサンプルは、99.8%以上の絶対エタノール(Sigma-Aldrich)で全量を採取し、抽出物を直接処理した。

睡眠制限と概日リズムのズレに関する実験プロトコールは既報の通りである31。食事および食品サンプルは、コロラド臨床・トランスレーショナル科学研究所の臨床・トランスレーショナル研究センター栄養コアが調製した。食品は研究施設に輸送され、入院研究期間中は冷蔵保存された。個々の食事はサンプリングされ、ジップトップバッグに入れて冷凍保存された。これらはサブサンプリングおよびLC-MS/MS分析前に-70℃で保存された。画像は、別の Sleep Study フォルダ(MSV000084900)に含まれています。

いくつかのヒト研究については、関連食品(研究および地域特異的食品用語(SSF))のデータを収集し、Global FoodOmics サンプルと同じ方法に従って処理した。コホートごとのSSFサンプルの数をここに概説する: 実験的睡眠制限および概日リズムのずれ(197 サンプル;45 サンプルはプール);百寿者(38 個の個別サンプル);マラウイの豆類サプリメント(14 個;2 サンプルタイプ、複数の抽出タイプ);医療的複雑性を有する小児(24 個の粉ミルクサンプル;11 個の完全重複);関節リウマチの食事サンプル(20 個の個別サンプル;2 サンプルタイプ(便、血漿)、3 時点));母乳(58 個の牛乳サンプル);豆類サプリメント(15 個の個別豆類サンプル;6 種類)。

コミュニティベースの科学的収集
サンプリング期間中、カリフォルニア州だけでなく、さまざまな州や国(マラウイ、ベネズエラ、イタリア、ブラジルなど)から、50人以上の個人からサンプルを受け取った。家庭菜園で採れた農産物、家庭で発酵させた製品(ヨーグルト、コンブチャ、ザワークラウト)、個人経営の農場で採れた肉や乳製品、個人が興味をもって購入したものなど、個人からの提供は多岐にわたった。

また、Venissimoチーズ、Good Neighbor Gardens、サンディエゴ動物園とサンディエゴ動物園サファリパーク、Sprouts Farmers Market、Whole Foods Market、Ralphsなどの地元スーパーマーケットなど、地元の店舗や団体に直接招待され、試食させていただきました。サンディエゴ発酵者クラブの創設者オースティン・デュラント氏からサンディエゴ発酵者クラブの会合に招待され、2017年のオレゴン発酵祭だけでなく、2018年のサンディエゴ発酵祭でも複数の業者からサンプリングを行いました。また、米国とメキシコの国境にある農家から柑橘類のサンプルを受け取ったが、その農家が特に懸念していた大気汚染により、目に見えて肌が黒くなっていた。その他のサンプリングは、関節リウマチコホートやCOVID-19研究のように、研究デザインと関連して行われた。合計で3,579サンプルのこのデータセットを作成するために、幅広い個人、組織、企業、科学者と協力し、現在も拡大中である。この最初のデータセットに含まれる食品の大部分は、カリフォルニア州でサンプリングおよび/または購入されたものであり、さらに拡大する余地が残されている。

このサンプル・セットには、果物、野菜、穀物/豆類、そして多くの食品の基礎となる生の肉や魚など、単純な食品が幅広く含まれている。さらに、1,133の発酵食品サンプルがある。このような食品の小分類は、後述するこれらのサンプルについて収集されたメタデータによって可能になっている。データセットに含まれるサンプルの幅が広いため、サンプルに関する様々な情報を慎重に照合する必要があり、その結果、これらの食品および飲料サンプルの様々な側面を説明する157の異なるメタデータ・カテゴリーが得られた(補足表1)。

食品は主に米国で消費されているが、食品の世界的な分布を反映して、原産地は50以上の異なる国または地域であることが確認された(アルゼンチン、オーストラリア、オーストリア、ベルギー、ボリビア、ブラジル、カナダ、チリ、中国、コロンビア、クロアチア、エクアドル、イギリス、エチオピア、フランス、ドイツ、ギリシャ、グアテマラ、 ハイチ、オランダ/オランダ、インド、インドネシア、アイルランド、イスラエル、イタリア/サルデーニャ、日本、ケニア、韓国、マダガスカル、マラウイ、メキシコ、ニュージーランド、ニルギリ、ペルー、フィリピン、ポーランド、セルビア、ポルトガル、ロシア、スコットランド、南アフリカ、スペイン、スイス、台湾、タイ、トリニダード・トバゴ、トルコ、イギリス、アメリカ/プエルトリコ、ベトナム、ベネズエラ; 一部、米国、EU、南米など大陸別のラベルが貼られているものもある)。

メタデータの管理
各サンプルに関する詳細情報は、メタデータの形で収集された。各食品には 157 のメタデータ・フィールドがある。メタデータは配列形式で、各行が1つのサンプルを表し、各列がサンプルに関する固有の情報をキャプチャします(メタデータファイルの補足情報、およびMassive MSV000084900のメタデータを参照)。このマトリックスにより、食品をさまざまな属性で分類し、これらの属性をサンプル番号、データファイル(.mzXMLファイル名)、Qiitaの16S配列情報(sample_name)にリンクすることができる。最初に取得したメタデータのカテゴリーには、サンプルの説明、サンプル番号、サンプルが採取された場所、サンプルの重量(サンプル前、サンプル後、サンプルの重量)、サンプルが採取された日、サンプルが撮影され、サンプル番号と一致するように名前が変更され、画像レポジトリにアーカイブされているかどうかが含まれる。最初の9つのカテゴリは最小限の情報を取得し、サンプルに関する情報の追跡を可能にした。

サンプル収集の過程で、収集されたサンプルの多様性から、サンプルに関するより多くの情報を取得し、それらを分類して異なる属性を比較できるようにするために、列を追加する必要が生じた。これらのカラムは、各サンプルに関する非常に詳細な情報、例えば、サンプルがオーガニックかどうか、生か調理済みかどうか、サンプリング前に洗浄したかどうか、チーズサンプルの場合、果皮か凝乳か、などを把握するために増えていった。カラムが追加されると、初期カラムと画像レポジトリを使用して情報をトレースバックした。

上記のセクションでは、食品リファレンスデータセットのメタデータについて説明したが、理想的には、確立された統制オントロジーを使用することである。例えば、緯度によるヒトの代謝変化について関心がある場合、管理されたメタデータは緯度情報を持つべきである。ここで提供した例以外にも、RDDを使ってさまざまな質問に答えるために、ユーザーが使いたいオントロジーがあるかもしれない。そのような場合、利用可能であれば既存のオントロジーを使用するのがベストである。https://www.ebi.ac.uk/ols/index、オントロジー検索サービスがある。

EMP26、BIOM32、REDU33、REDBIOM34は、著者が以前に作成した体系的なメタデータ取得アプローチの例である。適切なメタデータは制御された語彙を使用し、体系的な方法で収集するのは面倒で時間がかかる-通常、サンプルやデータそのものを収集するよりも時間がかかる-が、データの解釈を改善するためには不可欠である。

分類スキーム
食品を記述するために様々な分類法が使用されていますが、サンプルの多様性を把握し、メタデータを管理可能な数のカテゴリに絞り込んで、異なる食品クラスのメタボロームの違いを区別できるような確立されたスキームを見つけることができませんでした。そこで、サンプルが食品、飲料、その他のアイテム(サプリメントなど)のいずれであるかを把握する sample_type によって食品を分類し、食品の種および植物学的定義を考慮した独自の分類を拡張して形作りました。sample_typeカテゴリには、異なる物理的環境から調達された品目を区別するためのsample_type_land_aquaticから、動物園の食べ物やキャンディーなど、メタデータに他の方法では捕捉されなかった特定の食品グループを表現することを可能にするsample_type_commonまでがある。sample_typeグループには、食品に特化したgroup1からgroup6までの階層(本原稿ではレベル1から5を参照)と、飲料に特化した情報(アルコール(バイナリ)、炭酸(バイナリ)、飲料の種類(赤ワイン、ケフィア、ソーダなど))を含むgroupB1からgroupB3も含まれる。

複雑なサンプル
上記の分類スキームにより、単純食品(原材料が1つしかなく、そのため最後のグループレベルまで記入できるもの、例えば赤いプチトマトなど)については十分に詳細な情報が得られた。複雑な食品は複数の成分を含むだけでなく、成分表のある高度に加工された食品、家庭料理や外食も含む。このような食品は、知られている情報のばらつきが大きい。入手可能な場合には、上位 6 つの原材料が個別のメタデータ・カテゴリーに分類され、残りの原材料を含む 7 番目の原材料フィールドが設けられる。しかし、成分の順序は必ずしも食品の種類を明確に反映しているとは限らず、木の実のように微量しか 含まれていない可能性のある成分もある。sample_type_commonカテゴリーは、サンプルのタイプ(キャンディー)に関する情報の一部を捉えている。しかし、異なる成分のタイプを具体的に分類するために、我々は、共通カテゴリー(トウモロコシ、乳製品*、卵*、果物、真菌、魚*、貝*、肉、ピーナッツ*、海藻、大豆*、木の実*、野菜/ハーブ、小麦*、アスタリスクは既知の食物アレルゲンを示す)の既知の存在に基づいて、特定の複合食品オントロジーを生成した。) これらのカテゴリは、主な食品グループと最も一般的なアレルゲンを反映しています(US FDA Food Allergen Labeling And Consumer Protection Act of 2004; https://www.fda.gov/food/food-allergensgluten-free-guidance-documents-regulatory-information/food-allergen-labeling-and-consumer-protection-act-2004-falcpa)。食品メタボロームデータをヒトの糞便材料(食べた食品が既知または未知の場合)などの他のデータセットと相関させる際に注目される項目です。

発酵食品
保存および加工方法はメタデータに含まれる。ただし、食品メタボロームの変化における発酵の潜在的重要性、および発酵食品に期待される健康上の利点のため、この特徴を強調するためにいくつかのカテゴリが含まれる:発酵の有無、生きた活性培養を含むかどうか、チョコレートを含むかどうか(チョコレートは発酵食品であるため、発酵カテゴリとクロスチェックされる)。発酵食品のリストには、発酵乳製品(ヨーグルト、チーズ)、発酵肉/魚(サラミ、魚醤)、発酵野菜(キムチ、ザワークラウト)、発酵果実(チョコレート、コーヒー、リンゴ)、発酵穀物/豆類(パン、テンペ)が含まれ、サンプルの多くの種類を横断している。

食品特有のカテゴリー
個々の食品カテゴリーによっては、特定のカテゴリー分けが必要なものもある。例えばチーズには、チーズ_パート(凝乳と果皮)、チーズ_タイプ(ウォッシュ、ブルーなど)、チーズ_テクスチャー(ソフト、セミソフト、セミハード、ハード)という特定のカテゴリーがある。特に果物、野菜、穀物など、多くの食品素材の基礎となる生の植物製品については、植物学的情報、すなわち植物学的_解剖学(果実、葉、塊茎、種子など)、植物学的_属、植物学的_属_種(既知の場合)を収集した。紅茶サンプルは、茶葉の品質と茶葉の種類を別個のカテゴリーとして持つ。

研究間比較のためのメタデータ
研究間の比較を容易にするため、Earth Microbiome Projectのオントロジーであるempo_1(レベル1:自由 生息、宿主関連、対照、または未知)、empo_2(レベル2:塩類、非塩類、動物、植物、または真菌)、およびempo_3(レベル3:最も具体的な生息地名) (http://earthmicrobiome.org/protocols-and-standards/empo/)を含めた。可能な限り、食品を食品識別子にリンクするか、米国農務省の Food and Nutrient Database for Dietary Studies 2011-2012 (FNDDS)の食品グループ分けスキーム(https://www.ars.usda.gov/ARSUserFiles/80400530/pdf/fndds/fndds_2011_2012_doc.pdf)で定義されている既存の枠組みをベースとした識別子とカテゴリーを作成した。RDDで様々な質問に答えるために、ここで取り上げた以外にも、ユーザーが使用したいオントロジーがあるかもしれない。そのような場合、既存のオントロジーがあればそれを使用するのが最善である。https://www.ebi.ac.uk/ols/index、オントロジー検索サービスがある。

代謝物の抽出
サンプルは95%エタノールに懸濁し、組織溶解器で25Hz、5分間ホモジナイズした。ホモジナイズしたサンプル(エタノール中)を-20℃で40分間インキュベートし、20,000 r.p.m.で4℃、15分間遠心した(Eppendorf centrifuge 5418)。400μlの上清を96ウェルディープウェルプレートに移し、遠心蒸発により乾燥させた(Labconco Acid-Resistant Centrivap Concentrator)。乾燥抽出物を150μlの再懸濁液(2μMスルファジメトキシンを含む50%メタノール)に再懸濁し、2分間ボルテックスした後、ウォーターバス(Branson 5510)で5分間超音波処理した。その後、再懸濁した抽出物を20,000 r.p.m.、4℃で15分間遠心分離し(Thermo SORVALL LEGEND RT)、96ウェル浅井戸プレートに移し、質量分析検出器が飽和しないように5倍または10倍に希釈した。

液体クロマトグラフィー質量分析
逆相C18カラムにガードカートリッジ(Kinetex、100×2.1 mm、粒子径1.7 μm、ポアサイズ100 Å、Phenomenex社製)をプレペンドしたUltiMate 3000超高性能液体クロマトグラフィーシステム(Thermo Scientific社製)を用い、カラムコンパートメント温度40℃で食品抽出物を分析した。サンプルは0.5 ml min-1の一定流速で、以下のグラジエントを用いてクロマトグラフ分離した:5% Bで1.5分アイソクラティック、8分で100% Bまで、100% Bで3分アイソクラティック、0.5分で5% Bに戻し、その後5% Bで1.5分アイソクラティック(A:H2O + 0.1% ギ酸、B:アセトニトリル + 0.1% ギ酸(LC-MSグレード溶媒、Fisher Chemical))。

超高性能液体クロマトグラフィーシステムは、エレクトロスプレーイオン源を装備したMaxis Q-TOF Impact II質量分析計(Bruker Daltonics)に連結した。質量スペクトルは、m/z 50-1,500の質量範囲で、データ依存の取得を使用して正イオン化モードで取得した。装置は、ESI-L Low Concentration Tuning Mix(Agilent Technologies)を用いて、1日2回、質量精度1.0 p.p.m.に外部校正された。ロックマス補正には、Hexakis (m/z 622.029509; (1H,1H,2H difluoroethoxy)phosphazene; Synquest Laboratories) を使用した。MS/MSスペクトルは、各MS1スペクトルの上位5イオンについて取得し、2回のスペクトルの後にアクティブ排除を行った(30秒間維持)。この装置で一般的に使用されるロックマス値だけでなく、既知の汚染物質も除外リストに追加した(m/z値を記載): 144.49-145.49; 621.00-624.10; 643.80-646.00; 659.78-662.00; 921.0-925.00; 943.80-946.00; 959.80-962.00.

生の高分解能質量分析データファイルは、ロック質量補正(m/z 622.0290)を行った後、Bruker DataAnalysisソフトウェアを使用してオープンソースの.mzXML形式に変換した。生データファイルおよび変換後の.mzXMLファイルは、MassIVE(一意の識別子MSV000084900で一般公開)にアップロードされ、さらにGNPS(https://gnps.ucsd.edu)で、以下に説明するように解析された。

FDR推定
FDR推定は、GNPS21,35のPassatutto解析ワークフローを用いて計算した。FDR推定は、1%のFDRを達成するために最低5つのマッチしたピークで必要なコサイン値を決定するために使用された。アクセッション情報については、Data Availabilityのセクションを参照。

GNPSを用いた分子ネットワーキング
簡単に説明すると、分子ネットワーキングは、まずMS-Cluster36を使用して、研究のすべての同一スペクトル、アノテーションのための構造参照ライブラリ、および食品データをマージすることによって達成される。マージされたスペクトルは、修正コサインスコアのGNPS実装を使用して、イオン間の質量差を考慮してアライメントされます。このプロセスの間、メタデータは追跡される。ネットワークが作成されると、結果のデータテーブルを下流の分析に使用することができます。分子ネットワークの詳細に関する最初の報告はref. 16を、分子ネットワーキングのGNPS実装についてはref. 35を、分子ネットワーキングのステップバイステップのインストラクションガイドはref. 37を、分子ネットワーキングの使用法や解釈に関する総説はref. 17.

分子ネットワーキングの解析とライブラリ検索は、GNPS classic molecular networking release_1835を用いて行った。3579.mzXMLデータファイル(MassIVE ID MSV000084900で入手可能)を解析に含めた。データは、プリカーサーの m/z から+/- 17 m/z 以内の MS/MS ピークをすべて除去することでフィルタリングした。MS/MSスペクトルは、スペクトル全体の±50 m/zウィンドウの上位5ピークのみを選択することによってウィンドウフィルターした。その後、MS-Clusterを用いて、親質量の許容誤差0.02 m/z、MS/MSフラグメントイオンの許容誤差0.02 m/zでデータをクラスタリングし、コンセンサススペクトルを作成した。さらに、2つ未満のスペクトルを含むコンセンサススペクトルは破棄されました。次に、コサインスコアが0.65以上(FDRの計算に基づいて研究ごとに若干異なる)で、5つ以上のピークが一致するようにエッジがフィルタリングされたネットワークが作成された。さらに、2つのノード間のエッジは、各ノードが互いに最も類似している上位10個のノードに現れる場合のみ、ネットワークに残した。次に、ネットワーク内のスペクトルをGNPSスペクトルライブラリに対して検索した。ライブラリのスペクトルは、入力データと同じ方法でフィルタリングされた。ネットワークスペクトルとライブラリスペクトル間のすべてのマッチは、ライブラリ検索と同じコサインスコアと最小マッチピークを持つことが要求された。COVID-19データセットを除き、すべての研究の処理にはバージョンリリース18が使用されました。

Molecular Networking 解析では、GNPS 解析インフラストラクチャがパブリックデータのアノテーションに使用している 150,633 のパブリックリファレンススペクトルのスペクトルライブラリを利用しています。このスペクトルライブラリには、現在、3 つの MassBanks(日本、EU、北米)38、HMDB39、ReSpect40、NIH 天然物ライブラリ41、PNNL 脂質ライブラリ42、Bruker/Sumner、FDA ライブラリ、Gates Malaria ライブラリ、EMBL ライブラリ、その他多くの GNPS 寄託ライブラリ(https://gnps. ucsd.edu/ProteoSAFe/libraries.jsp)38、および市販の NIST17 ライブラリ(CID 部分のみ)。分子ネットワークは、GNPSブラウザーおよびフリーで利用可能なプログラムCytoscape(v.3.5.1)で可視化した43。

解釈されたスペクトル率計算
ヒトまたは食品データから得られた MS/MS スペクトルとライブラリスペクトルとのスペクトルマッチは、分子 ID を構成し、解釈されたスペクトルの初期パーセンテージを決定する。ヒトサンプルとリファレンスサンプルのMS/MSスペクトル間のスペクトルの一致(データセットの分子ネットワーキングを一緒に実行し、2つのグループ間で重複するノードを特定することにより)は、潜在的なソースを示します。従って、ヒトと食品のデータ間の一致は、その分子の潜在的な供給源として食品を示唆している。食品参照データは、Global FoodOmics データセット(GFOP;広範な食品および飲料)と SSF( 一部の参加者が摂取していることが知られている食品および/または飲料)の 2 つの主要カテゴリーで参照される。最後の解釈レベルは、分子ファミリー内の連結性に基づいており、これにより食品由来化合物の構造的関連性や代謝の可能性を推測することができる。

分子ネットワーク解析では、食品参照データとヒトのデータを別々のグループに整理した。アノテーション率と解釈されたスペクトル率は、R(3.6.3)とtidyrおよびdplyrパッケージを使用して計算した。まず、すべての研究(便、血漿など)について、パーセントアノテーション率、すなわち分子IDを計算した(例えば、分子IDを持つ便ノードの数/便ノードの総数)。食品参照データとヒトMSデータ間のスペクトルの一致(2つのグループ間のオーバーラップ)は、解釈されたスペクトル率(例えば、食品と便データで見つかったノードの数/便ノードの総数)と呼ばれる次のレベルの情報を提供し、潜在的な食品ソースを示します。

参照ライブラリへのアノテーションがない分子については、分子ネットワーキングを用いてその存在を説明できる可能性を測定したかった。各データセットの単一ループを除去し、注釈付き化合物と成分インデックスを共有する代謝物を比較することで、同じ分子ファミリーに属する分子を同定して分類の可能性を推測し、注釈付き分子とネットワークを形成する未注釈分子を各サンプルタイプ内の代謝物合計で除算することで、解釈されるスペクトル率を計算することができました。サンプルタイプ間のオーバーラップは、サンプルタイプ間の分子の共ネットワークの寄与を理解するために再度評価され、データセットで見つかった未注釈分子を説明する能力を向上させた。可視化はgraphicsとbeeswarmパッケージを使って作成し、有意差はWelchのt検定(stats::t.test)、WelchのF検定(onewaytests::welch.test)、多重比較のためのGames-Howell検定(rstatix::games_howell_test)を使って計算した。すべてのデータは平均値±標準誤差で表され、特に断りのない限り、P < 0.05の場合に有意とみなされる。

例えば、GNPS 分子ネットワーク解析では、試験データセットは一貫してグループ 1(G1)(便と血漿のような対になっ たデータセットの場合は G2)に配置され、Global FoodOmics データはグループ 4(G4)に配置された。SSFが使用された場合は一貫してG3に配置された。G1 と G4 の間の共通ノードは、参照データセットから直接得られる情報の重複と潜在的な強化を表す。したがって、改善は、G1とG4の重複をG1の総ノードで割った差と、G1の注釈の数をG1の総ノードで割った差で測定される。伝播」とは、分子ファミリー内の連結成分内のノードのカウントを意味し、3種類の追加情報を捕捉する: 1)G4で見つかった注釈付き化合物(G4のみで観察された注釈付き分子、またはG4とG1で観察された注釈付き分子である可能性がある)とネットワークを形成しているG1のみで見つかった注釈なし化合物、2)G1のみで見つかった注釈なし化合物であるが、注釈なし食品化合物(G4)と同じ分子ファミリー内にある化合物、または3)G1のみで見つかった注釈なし化合物であるが、注釈付き食品化合物(G4)と同じ分子ファミリー内にある化合物。Totalに示された増加は、3つの異なるタイプの分子連結からのユニークなノードの数を考慮している。番目が最大の寄与者である。

メタデータの推論 - 比例する食品カウントの生成
食品数は、食品サンプルに一致する分子ネットワーク結果のコンセンサスノードの数として計算された。コンセンサスノードは、関連するすべての実験グループ(サンプルタイプ、GFOP、任意でSSF)に一致し、他の実験グループのいずれにも一致しないことが要求された。フィルタリングされたコンセンサスノードに対応するすべてのソースファイル名をGFOPファイル名およびメタデータと照合し、食品階層の異なるレベルにおける食品のカウントを導出した。水よりも出現頻度の低い食品タイプ(ブランクと推定)は、散発的なランダム一致をフィルタリングするために除去した。これはすべての分析で行った。フロー図のために、完全なデータセットの食物数をメタデータ階層のさまざまなレベルで計算した。フロー図は、Pandas(v.0.25.3)、NumPy(v.1.18.1)、および floweaver(v.2.0.0a5)を使用して Python(v.3.8)で生成した44,45,46。

RDDメタボロミクスベースの食品カウントには考慮すべき注意点があります。第一に、データベースを使用するため、出力を解釈する際にはデータベースの深さ、広さ、および種類を考慮する必要がある。一般的な食品データベースを地域の食品で拡張することにより、一致するスペクトルの数が増加したが、参加者の食事日記にはまだ食品データベースに捕捉されていない食品が含まれていた。より完全なカバレッジを達成するために、高品質の関連メタデータとともにデータベースを拡張するための地域社会からの貢献によって、最終的にこの問題は解消されるであろう。もう1つの考慮点は、ある分子がヒトによって生産される可能性があるが、異なる食餌源にも含まれる可能性があること(例えば、人体で生産されるコレステロールと食肉から摂取されるコレステロール)、あるいはビタミン(例えば、パントテン酸)やフラボノイドのように動物源から観察される分子が、それらを摂取する動物でも観察されることである。しかし、RDD法は単一のMS/MSマッチに依存するのではなく、数十から数千のマッチを集約して、食品カテゴリーの特定の相対的な割合を示すシグネチャーにする。このような一致の重なりは、ヒトのデータから観察されたMS/MSの特徴が、ソースとしての参照データに由来する可能性があるという仮説の定式化に依然として寄与している。

図2e,fでユニークなスペクトルのみを使用した以外は、すべてのスペクトルのマッチングを図に使用したが、マッチングによってはオントロジーのレベル1までしか希望する精度と正確さが得られない場合があるが、他のマッチングはレベル6まで正確で精度が高い場合があるため、結果を過大解釈しないように注意が必要である。言い換えれば、植物と動物(レベル1)を完全に分ける分子はもっとたくさんあるが、赤いトマトと黄色いトマト(レベル6)を容易に分けるには不十分かもしれない。fでは、より細かい分解能を得るために、固有のMS/MSデータのみを明示的に使用しています。つまり、肉の代わりに、豚の肉と牛の肉のどちらに多く一致するかを(割合で)示すことができますが、それはそのレベルに固有のスペクトルがある場合にのみ可能です。これは16SリボソームRNA遺伝子のV4増幅や、マイクロバイオームシーケンスにおける関連増幅法と非常によく似ている。場合によってはデータから種の同定が可能なこともあるが、ほとんどの場合は属レベルの同定しかできない。しかし、V4シーケンス法はマイクロバイオームを理解するために幅広く利用されている。また、比較対象が3,600食品のデータに限られていることもわかっているが、これはこうしたアプローチの発展の始まりに過ぎない。次の 10 年では、多くの新しいアルゴリズム、より多くのデータの利用可能性(メタボロミクスコミュニティの大半はまだデータを公 開していない)、および手法(特に参照データベースが数十万から数百万になるにつれて)が必要になると予想されるが、本論文で定義した概念を使用して参照データを活用し続ける予定である。

スパイクされた標準試料からのスペクトルの回収
2種類のヒト糞便生物試料とNIST 1950血漿リファレンスを、それぞれトマト苗(Solanum lycopersicum plant)の割合を増やして混合し、超高速液体クロマトグラフィーを用いて分析した。このデータは過去に発表されたものである20。簡単に説明すると、サンプルを7/3メタノール/水に溶解し、組織溶解器で25Hz、5分間ホモジナイズした。その後、チューブを15,000 r.p.m.で15分間遠心し、上清を回収した。抽出物を以下の(生物試料:苗)比率で混合した: 100:0、75:25、50:50、25:75、0:100。各サンプルとニートトマト苗(参照サンプル、0:100)のMS/MSマッチ数を計算した。苗の割合と苗のスペクトルマッチ数との間の線形関係の有意性を、反復測定相関を用いて検定した。また、各試料と基準試料、および各試料と非植物性食品基準群(食品オントロジーのレベル1)とのスペクトル一致の割合も算出した。

NISTの雑食者およびビーガン参照データからの食事情報
ヒトの全便は、BioCollectiveによりボランティアドナーから入手した。サンプルは、脱イオン水でホモジナイズし、1mlのバイアル瓶に分注した菜食主義者と雑食主義者のドナーの全便(コホートあたり4人のドナー)から構成される。サンプルは-80℃の水性凍結乾燥状態で保存された。

各糞便サンプルと参照データベースに含まれる各食品とのMS/MS一致数の詳細を示す特徴表が作成された。食品カウントは、RのmixOmicsパッケージを使用して主成分分析(PCA)によりモデル化した。カウントは、いずれかの食事で優先的に摂取されることが知られている特定の食品カテゴリー(乳製品、肉類、魚介類、豆類、果肉類、野菜/ハーブ)について集計した。雑食サンプルと菜食サンプル間の各食品カテゴリーにおける正規化カウントの合計の差をWilcox検定により評価した。

アルツハイマー病患者における食事の変化
上述したように、各血清サンプルと各参照食品との間のMS/MS一致に基づいて特徴表を作成し、次に食事読み出しにおけるばらつきをPCAによって評価した。食事のアルファ多様性は、Shannon index(R package vegan)を用いて計算した。さらに、食品オントロジーの異なるレベル(L3、L4、L5)の特徴テーブルを作成し、カウントを合計して正規化した。食事パターンを決定するために、各食品カテゴリーとPC1間の相関(スピアマン)を計算した(RパッケージHmisc)。食事パターン(PC1)と研究グループ、年齢、および性別との間の関連は、異なるプレートでサンプルを実行することによるランダム効果を制御するために、線形混合効果モデル(Rパッケージlme4)を用いて評価した。pbkrtestに実装されているKenward-Roger近似F-検定は、モデル内の各固定効果の有意性を評価するために使用された。

データセットの説明
すべてのヒトのデータセットは、高分解能質量分析計のLC-MS/MS、ポジティブイオン化モードで処理され、複数の異なる生体流体と組織を表す5~2,123サンプルを含んでいた(補足表1)。

四重極型飛行時間型質量分析計を使用し、上記と同様の方法で以下の研究のデータを収集した: american gut (MSV000081981)、医療的複雑性を有する小児 (MSV000084610)、Rotarixワクチン反応 (MSV000084218)、Malawi legume supplement (MSV000081486)、IBD_1 (MSV000082431)、IBD_individual (MSV000079115)、発酵食品摂取 (MSV000081171)47、睡眠制限と概日リズムのずれ (MSV000083759; IRB 15-0282)、百寿者(MSV000084591; IRB 180478)、マメ科植物の補給(MSV000084663)、LP乳児(MSV000083462; MSV000083463)、IBD_seed(MSV000082221)、IBD_biobank(MSV000079777)、IBD_2(MSV000084775)、IBD_200(MSV000084908)30、IBD_biopsy(MSV000082220)、痛風(MSV000084908)、成人の唾液(MSV000083049)。

関節リウマチ(MSV000084556)およびアルツハイマー病(MSV000085256)に対する食事の影響に関するデータセットは、Q-exactive Orbitrap質量分析計(Thermo Scientific)を用いて同様の方法で収集した。アルツハイマー病のサンプルにはアルツハイマー病と高齢者のコントロールが含まれ、少なくとも6時間の絶食後の早朝に採取された。

COVID-19試験(MSV000085505; MSV000085537)の食物および血漿データは、ブラジルのサンパウロ大学で収集された。血漿サンプルは、リベイラン・プレット医科大学総合病院(HC-FMRP-USP)の感染症治療特別ユニット(UETDI)に入院した、検査でCOVID-19が確認された患者から採取した。この同意書には、本試験の一般的な提案、検体採取の手順、リスク、ベネフィットが記載されている。さらに、氏名、個人情報の守秘義務、いつでも参加を断念できることが保証された。署名の後、患者はインフォームド・コンセント用紙のコピーを受け取った。そこには次のような規定があった: 1) COVID-19が中等度、重度または重症と診断され、病院での治療が必要な患者、2) 18歳以上、3) 体重50kg以上、4) 入院時の心電図にリズムの変化がなく、QT間隔が450ms未満、5) 血清中のCa2+とK+が正常値、6) 18歳から50歳までの女性で、入院時のβ-HCG検査が陰性の患者。以下の患者は除外された: 1) SARS-CoV-2の軽症型である;2) 妊娠中である;3) 自由意思表示同意書に記載された情報を理解できない。

サンプル調製:COVID-19血漿サンプルについては、20μlのアリコートをエッペンドルフチューブに移し、120μlの冷抽出液、MeOH:MeCN(1:1、vol/vol)を加えた。分間オービタル振とう(Gehaka AV-2 Shaker)した後、-20℃で30分間放置し、4℃で20,000g、10分間遠心分離した(Centrifuge Boeco Germany M-240R)。有機相のアリコート(120μl)を別のエッペンドルフチューブに移し、回転真空濃縮機で60分間、30℃で蒸発乾固した(Analitica, Christ RVC2-18)。残留物を80μlのH2Oに再懸濁し、遠心分離し(10分、5,000g、4℃)、5μlのアリコートを注入した。

血漿サンプルの質量分析データ収集のため、抽出物をHPLC(島津製作所)でクロマトグラフィー分離し、ESIイオン源と四重極飛行時間分析計(Bruker Daltonics Inc.)を備えたmicrOTOF-Q II質量分析計(Bruker Daltonics)を連結した。クロマトグラフィー分析には、Kinetex C18カラム(1.7 µm、100 × 2.1 mm)(Phenomenex社製)を用い、流速0.3 ml min-1で40℃に保った。リニアグラジエントを適用した: 0-1.5 min isocratic at 5% B, 1.5-9.5 min 100% B, 9.5-12 min isocratic at 100% B, 12-12.5 min 5% B, 12.5-14 min 5% B; 移動相Aは0.1%ギ酸(vol/vol)を含む水、Bは0.1%ギ酸(vol/vol)を含むアセトニトリル(LC-MSグレード溶媒)。MSデータは、m/z 50-1,500のMSレンジを使用してポジティブモードで取得した。装置は毎日トリフルオロ酢酸で校正され、各運転中に内部で校正された。MSパラメータは以下のように設定した:エンドプレートオフセット、450 V;キャピラリー電圧、3,500 V;ネブライザーガス圧力、4.0 Bar;乾燥ガスフロー、9 l min-1;乾燥温度、220 °C。

データ依存の取得では、MS1スキャンごとに最も豊富な5つのイオンがフラグメント化され、スペクトルが収集された。フラグメンテーション除外リストは、既知の汚染物質と注入されたロックマス化合物を除外するために設定された:m/z 144.49-145.49; 621.00-624.10; 643.80-646.00; 659.78-662.00; 921.0-925.00; 943.80-946.00; および 959.80-962.00。プロセスブランクは5サンプルごとに実行した。50% MeOH(LC-MSグレード溶媒)中の標準混合溶媒(パクリタキセル1 mg l-1、ジアゼパム1 mg l-1)(Sigma-Aldrich)5 µlを5サンプルごとに注入した。すべてのMSデータはBruker Compass DataAnalysis 4.3 software (Bruker Daltonics)で解析した。

メタデータファイルは、検査室でCOVID-19が確認された患者から入手可能なすべての臨床情報と必須の分析仕様をグループ化して作成された。MS/MSデータは内部標準(トリフルオロ酢酸)で校正し、ProteoWizardソフトウェアのMSConvertを使用して.mzXMLファイルに変換し、Global Natural Products Social Molecular Networkingウェブプラットフォーム(https://gnps.ucsd.edu/)にアップロードした。すべてのMSデータ(.mzXMLファイル)とメタデータ(.txtファイル)は、GNPS/MassIVE(https://massive.ucsd.edu/)を通じて、アクセッション番号MSV000085373で一般公開されています。

データセットを作成するためのリソース
Shaping the Microbiome Through Nutrition UCSD-Nature Publishing conferenceの一環として行われた導入ワークショップが録画されている。https://ccms-ucsd.github.io/GNPSDocumentation/workshops/。ステップバイステップのガイドとビデオについてはhttps://ccms-ucsd.github.io/GNPSDocumentation/tutorials/rdd/、対応するビデオチュートリアルhttps://www.youtube.com/watch?v=2-XsifrUY0Y。

報告書の要約
研究デザインに関する詳細は、この記事にリンクされているNature Research Reporting Summaryを参照されたい。

データの利用可能性
以下のファイルは、Global FoodOmics mzXML ファイルに加えて、MSV000084900 の下、https://massive.ucsd.edu から入手可能である:メタデータ(a.txt);サンプリングされた食品 1 品目につき 1~6 枚の画像を含む画像レポジトリ;FDR ベースのパラメータの表;睡眠制限および概日リズムのずれに関する研究のフルサイズ PDF;食品参照データの分子ネットワーク(図 1 に抜粋あり)。メタデータディクショナリは、https://docs.google.com/spreadsheets/d/1Ebn-TgMWEkd_7KOw9TCRvHGPsE7dGjVCr7dg28pwbmM/edit#gid=727944641。メタボロミクス生データファイルのアクセッション番号は、補足表2から入手できる。本研究で使用したGNPSベースの分子ネットワーキング解析ジョブは、以下のリンクからオンラインでアクセスできます:睡眠と概日研究(MSV000083759、https://gnps.ucsd.edu/ProteoSAFe/status.jsp?task=e0bf255bcb2e492bb0be3be1a691b5fb、https://gnps.ucsd.edu/ProteoSAFe/status.jsp?task=6fe434761daf4f9da540cf1fd90b3985、https://gnps.ucsd.edu/ProteoSAFe/status.jsp?task=9a90bd12f51e453e968656e6458e0da4);百寿者(MSV000084591、https://gnps.ucsd.edu/ProteoSAFe/status.jsp?task=8895b6e3445546c4a5bc3a726a920227、https://gnps.ucsd.edu/ProteoSAFe/status.jsp?task=981c9a7d39f742bda296d52f856981e5);関節リウマチに対する食事の影響(MSV000084556、https://gnps.ucsd.edu/ProteoSAFe/status.jsp?task=0794151fce2c4c18a7a0aa3a09140169);LP乳児(MSV000083462、MSV000083463、https://gnps.ucsd.edu/ProteoSAFe/status.jsp?task=a7b222466ef844e69cdbd9835d2f6c39、https://gnps.ucsd.edu/ProteoSAFe/status.jsp?task=c756a9dfb5c34a2a8655f88114edf0a8、https://gnps.ucsd.edu/ProteoSAFe/status.jsp?task=4a322e640bb644068030949267fb4ea)。ネットワークパラメータは、GNPS上のMOLECULAR-LIBRARYSEARCH-FDRワークフローに基づき、以下のタスクIDで設定した: GFOP3500, a7bf6cc3f91d466bab923f2268d6f4fc; sleep deprivation, b55ab4004ed342d7b4ed1c488e935998; sleep study, 78bbfed8574748d1a77dc7c2f1a44d39; sleep study_SSF_test, b55ab4004ed342d7b4ed1c488e935998; centenarian, 265a9553c69e47499cca3de056b43178; centenarian_SSF_test, 265a9553c69e47499cca3de056b43178; American gut, aee5dde3b2f84079a264e68ec981487e; 発酵食品の消費(a44d1b2e1b9d4612974d0b85021675a7);マラウイの豆類サプリメント(de7b55f8adaa4ad9b2a8430e30435bf3);医学的複雑性を有する小児(f27243af071b43ab90d846bda959fc1c); Rotarix vaccine response, a2e02e3f97a54ca08e3866cc60f8d42b; diet impact of diet on rheumatoid arthritis, 62b8754e761549f3b94ffae83d7ab95a; LP infant, 532aba2ad3644fadba0e6e7ea063c7ee; IBD_1, bb10b1ce90a24f3a9cef1e85e88c3882; IBD_biopsy, c4cfda90933b4842a7154f5f2def139d; IBD_individual, 3ce8cc636ae944848b4ada322aaf12fe; IBD_seed, ebb715fc605457ba5f7e910b79d6177; IBD_biobank, 9465c34cf5444e12b89318b1fb363714; IBD_2, 983fa9271136404fb5743b44a6a109f0; IBD_200, e5acf5726722486caa897b2b07d402e8; Alzheimer's disease, 658103164325425981c097cecba840b0; Alzheimer's disease serum, 67516099b37647f2a9c91f890366bef3; 雑食 vs 菜食, ba974d08cab04f77aaacdb7828baada6; 痛風, a478f419ae824378aa02e5e1b310cad2; 成人唾液, 32980f95dbd5437aaa9e15d05c7246bb; LP幼児, 8bfbdc1bf38c418fb223306cd42af897; LP infant, 3e414e13a4394bb78c07f7ca7f4d1be3; legume supplementation, 2ca007303b9c4bb3820f392b996eba27; COVID-19 Brazil, d16eb32276c84bdb9c35c5872e97a986; Tomato seedling, f1c9cd79e0e94c66a367b6816b149750.

コードの利用可能性
この研究で生成されたコードは、https://github.com/DorresteinLaboratory/GlobalFoodomics。

変更履歴
18年10月2023A日 本論文の訂正を掲載しました: https://doi.org/10.1038/s41587-023-02025-x
参考文献
Knights, D. et al. Bayesian community-wide culture-independent microbial source tracking. Nat. Methods 8, 8761-8763 (2011).

論文

Google Scholar

RefEx、遺伝子の機能解析のためのウェブツールとしての参照遺伝子発現データセット。Scientific Data 4, 170105 (2017).

論文

CAS

PubMed

PubMedセントラル

Google Scholar

Bono, H. All of gene expression (AOE): 公開遺伝子発現データベースの統合インデックス。PLoS One 15, e0227076 (2020).

論文

論文

パブコメ

PubMedセントラル

Google Scholar

ヒトマイクロバイオームプロジェクト。Nature 449, 804-810 (2007).

論文

論文

PubMed

パブメドセントラル

Google Scholar

揮発性化合物BinBase質量スペクトルデータベース。BMC Bioinf. 12, 321 (2011).

論文

CAS

Google Scholar

メタボロームデータベースと質量分析ケムインフォマティクスの統合による代謝物の同定。Nat. Methods 15, 53-56 (2018).

論文

CAS

PubMed

Google Scholar

Bouslimani, A. et al. 個人プロファイリングのための携帯電話からの生活習慣化学物質。Proc. Natl Acad. Sci. 113, E7645 (2016).

論文

CAS

PubMed

パブメドセントラル

Google Scholar

Haug, K. et al. MetaboLights: 科学界のニーズに応えて進化するリソース。Nucleic Acids Res. 48, D440 (2020).

CAS

PubMed

Google Scholar

Damen, H. et al. Siscom-質量スペクトルの新しいライブラリ検索システム。Anal. Chim. Acta 103, 289-302 (1978).

論文

CAS

Google Scholar

Wang, M. et al. MASSTを用いた質量分析検索。Nat. Biotechnology 38, 23-26 (2020).

論文

Google Scholar

Robin S., et al. Nature Communications 12, 3832 (2021).

非標的メタボロミクスデータのグローバルアノテーションによる代謝物探索。preprint available at bioRxiv https://doi.org/10.1101/2021.01.06.425569 (2021).

Wang, M. et al. Global Natural Products Social Molecular Networking による質量分析データの共有とコミュニティキュレーション。Nat. Biotechnol. 34, 828-837 (2016).

論文

論文

PubMed

パブメドセントラル

Google Scholar

バラバシ、A.-L.ら。私たちの食事の地図に載っていない化学的複雑さ。Nat. Food 1, 33-37 (2020).

論文

Google Scholar

Maruvada, P. et al: 摂取と暴露の食事バイオマーカー-オミックス・アプローチによる探索。Adv. Nutr. 11, 200-215 (2020).

論文

PubMed

Google Scholar

生きた微生物コロニーのマススペクトル分子ネットワーキング。Proc. Natl Acad. Sci. 109, E1743-E1752 (2012).

論文

論文

パブコメ

パブメドセントラル

Google Scholar

創薬、薬物代謝、精密医療戦略としての分子ネットワーキング。Trends Pharmacol. Sci. 38, 143-154 (2017).

論文

CAS

PubMed

Google Scholar

Sprecher, K. et al.睡眠制限と概日リズムのズレの複合時における高次認知と覚醒維持能力の形質的脆弱性。Sleep 42, zsz113 (2019).

論文

PubMed

パブメドセントラル

グーグル・スカラー

Lungren, D. et al. 定量プロテオミクスにおけるスペクトル計数の役割。Expert Rev. Proteomics 7, 39-53 (2010).

論文

Google Scholar

Qemistreeを用いたメタボロミクス質量分析データの化学情報に基づく解析。Nat. Chem. Biol. 17, 146-151 (2021)。

論文

論文

パブコメ

Google Scholar

大規模メタボロミクスアノテーションのスペクトルマッチングによる有意性推定。Nat. Commun. 8, 1494 (2017).

論文

PubMed

パブメドセントラル

Google Scholar

Sumner, L. et al. 化学分析の最低報告基準の提案: 化学分析ワーキンググループ(CAWG)メタボロミクス標準イニシアティブ。Metabolomics 3, 211-221 (2021).

論文

Google Scholar

West, K., et al., NPJ Sci. Food 6, 22 (2022).

St. John-Williams, L. 他、ADNI1 および ADNIGO/2 コホートにおける胆汁酸標的メタボロミクスおよび投薬分類データ。Scientific Data 212, 1 (2019).

グーグル・スカラー

Aksenov, A. et al. ガスクロマトグラフ質量分析データの自動デコンボリューションと分子ネットワーキング。Nat. Biotechnol. 39, 169-173 (2020).

論文

PubMed

パブメッドセントラル

Google Scholar

Thompson, L. R. et al. A communal catalog reveals Earth's multiscale microbial diversity. Nature 551, 457-463 (2017).

論文

CAS

PubMed

パブメドセントラル

Google Scholar

McDonald, D. et al. American Gut: an open platform for citizen science microbiome research. mSystems 3, e00018-31 (2018).

論文

Google Scholar

Sicherer, S. H. & Sampson, H. A. 食物アレルギー: 疫学、病因、診断、予防、管理に関するレビューと最新情報。J. Allergy Clin. Immunol. 117, s470-s475 (2006).

論文

CAS

PubMed

Google Scholar

Martin, C. L., et al. USDA Food and Nutrient Database for Dietary Studies 2011-2012: ドキュメンテーションおよびユーザーガイド。メリーランド州ベルツビル:米国農務省。(Agricultural Research Service, USDA Food Surveys Research Group, 2012)。

Song, S. J. et al. 保存方法によって糞便マイクロバイオームの安定性が異なり、野外調査の適性に影響する。

論文

PubMed

PubMed Central

Google Scholar

睡眠制限と概日リズムのズレの組み合わせにおける高次認知と覚醒維持能力の形質的脆弱性(Sprecher, K. J. et al. Sleep 42, zsz113 (2019).

論文

PubMed

パブメドセントラル

Google Scholar

The Biological Observation Matrix (BIOM) format or: How I learned to stop worrying and love the ome-ome. Gigascience. 1, 7 (2012).

論文

PubMed

PubMed Central

Google Scholar

Jarmusch, A. K. et al. ReDU: 公開質量分析データの検索と再解析のためのフレームワーク。Nat. Methods 17, 901-904 (2020).

論文

論文

パブコメ

パブメドセントラル

Google Scholar

McDonald, D. et al. redbiom: a rapid sample discovery and feature characterization system. mSystems 4, e00215-19 (2019).

論文

PubMed

PubMed Central

Google Scholar

Wang, M. et al. グローバルな天然物ソーシャル分子ネットワーキングによる質量分析データの共有とコミュニティ・キュレーション。Nat. Biotechnol. 34, 828-837 (2016).

論文

論文

PubMed

パブメドセントラル

Google Scholar

Spectral archives: スペクトルライブラリを拡張し、同定および未同定のスペクトルを解析する。Nat. Methods 8, 587-591 (2011).

論文

論文

パブコメ

パブメッドセントラル

Google Scholar

Aron, A. T. et al. GNPSを用いた非標的質量分析データの再現可能な分子ネットワーキング。Nat. Protoc. 15, 1954-1991 (2020).

論文

論文

パブコメ

Google Scholar

蓬莱尚幸ほか: Massbank: ライフサイエンスにおけるマススペクトルデータ共有のためのパブリックリポジトリ. J. Mass Spectrom. 45, 703-714 (2010).

論文

論文

PubMed

Google Scholar

Wishart, D. S. et al. HMDB 4.0:2018年のヒトメタボロームデータベース。Nucleic Acids Res. 46, D608-D617 (2018).

論文

CAS

PubMed

Google Scholar

理研タンデムマススペクトルデータベース(ReSpect):植物特異的MS/MSデータベース. Phytochemistry 82, 38-45 (2012).

論文

論文

PubMed

Google Scholar

NCATS医薬品コレクション:10年間のアップデート。Drug Discov. 24, 2341-2349 (2019).

Google Scholar

Kyle, J. E. et al. LIQUID: an-open source software for identifying lipids in LC-MS/MS-based lipidomics data. Bioinformatics. 33, 1744-1746 (2017).

論文

論文

PubMed

パブメドセントラル

Google Scholar

ゲノム配列、遺伝子発現、遺伝学的構造、遺伝子発現プロファイル、遺伝子発現解析。ゲノム研究 13, 2498-2504 (2003).

論文

論文

パブコメ

パブメドセントラル

Google Scholar

Pythonによる統計計算のためのデータ構造. この論文では、Pythonを使った統計計算のためのデータ構造について解説している。

NumPy配列:効率的な数値計算のための構造体。Comput. Sci. Eng. 13, 22-30 (2011).

論文

グーグル・スカラー

Lupton, R. C. & Allwood, J. M. Hybrid Sankey diagrams: Visual analysis of multidimensional data for understanding resource use. Resour. Conserv. Recycl. 124, 141-151 (2017).

論文

Google Scholar

Taylor, B. C. et al. 発酵食品の摂取は、腸内細菌叢およびメタボロームの系統的差異と関連している。

論文

PubMed

パブメッドセントラル

Google Scholar

参考文献のダウンロード

謝辞
資金源:Crohn's & Colitis foundation #675191 , U19 AG063744 01, R01AG061066, 1 DP1 AT010885, P30 DK120515, Office of Naval Research MURI grant N00014-15-1-2809 and NIH/NCATS Colorado CTSA Grant UL1TR002535, the Emch Fund and C&D Fundに感謝する。本研究の一部は、Chancellor's Initiative in the Microbiome and Microbial Sciences、試薬提供によるイルミナ、およびUCSDのCenter for Microbiome Innovationとの提携によるDanone Nutricia Researchからも支援された。サンプル処理についてはE. Sayyari、D. S. Nguyen、E. Wolfe、K. Sandersに、データの取り扱い、処理、計算インフラの維持についてはJ. DeReusに感謝したい。J.P.S.はSD IRACDA(5K12GM068524-17)、一部はUSDA-NIFA(2019-67013-29137)およびアインシュタイン研究所GOLDプロジェクト(R01MD011389)の支援を受けた。R.C.とM.G.はKrupp Endowed Fundの支援を受けており、R.C.はNIH/NIAMS(T32AR064194)のUCSD Rheumatic Diseases Research Training Grantの支援も受けている。R.H.M.はNIH/NIDDK Gastroenterology Training Program (T32 DK007202)からのUCSD研修助成金を受けた。ブラジル科学技術開発評議会(CNPq)-ブラジル(245954/2012)からM.F.O.に、FAPESP(2014/50265-3)からN.P.L.に、D.W.はNIH/NHLBIトレーニンググラント(NIH T32HL149646)から支援を受けた。K.S.はPROMOS基金(DAAD)の支援を受けた。W.B.はフランダース研究財団(FWO)の博士研究員である。R.J.D.はNIH DP2 AT010401-01の支援を受けた。R. da Silva 氏による Global FoodOmics プロジェクトのフィードバックおよび初期のバイオインフォマティクス解析に感謝する。さらに、サンプルを提供してくれたすべての個人、およびサンプルを提供してくれた企業・団体に謝意を表する: D. Vargas、Townshend's Tea Company、BDK Kombucha、Oregonian Tonic、Squirrel & Crow、Venissimo cheese、Fermenter's Club San Diego、Good Neighbor Gardens、Sprouts Farmers Market、Ralphs、Whole Foods、Julian Ciderworks、San Diego Zoo and Safari Park。特に、発酵フェスティバルでのサンプリングをコーディネートしてくれたA.デュラントと、サンプル収集のコーディネートと手伝いをしてくれたサンディエゴ動物園ワイルドライフ・アライアンスの素晴らしいスタッフに感謝する: M. Gaffney、E. Galindo、K. Kerr、A. Fidgett、J. Stuart、D. Tanciatco、L. Pospychala。NISTはThe Institute for the Advancement of Food and Nutrition Sciences (IAFNS) microbiome committeeが標準化された糞便材料の開発を支援してくれたことに感謝したい。ADMC(Alzheimer's Disease Metabolomics Consortium、デューク大学のR.K.-D.博士率いる)の資金提供。 Dr.R.K.-D.(デューク大学)が率いるADMC(アルツハイマー病メタボロミクス・コンソーシアム)への資金提供は、Accelerating Medicines Partnership for AD(AMP-AD)Target Discovery and Preclinical Validation Project(https://www.nia.nih.gov/research/dn/ampad-target-discovery-and-preclinical-validation-project)の構成要素であるNational Institute on Aging助成金1U01AG061359-01およびR01AG046171、ならびにM2OVE-AD Consortium(Molecular Mechanisms of the Vascular Etiology of AD Consortium、https://www.nia.nih.gov/news/decoding-molecular-tiesbetween-vascular-disease-and-alzheimer)の構成要素であるNational Institute on Aging助成金RF1 AG0151550によって行われた。さらに、以下のNIA助成金(1RF1AG058942-01および3U01 AG024904-09S4)からも支援を受けた。ADNIのデータ収集および共有は、米国国立衛生研究所(National Institutes of Health)Grant U01 AG024904の支援を受けた。ADNIは、National Institute on Aging、National Institute of Biomedical Imaging and Bioengineering、および以下からの寛大な寄付によって運営されている: AbbVie、アルツハイマー病協会、アルツハイマー病創薬財団、Araclon Biotech、BioClinica, Inc.、Biogen、Bristol-Myers Squibb Company、CereSpir, Inc.、Cogstate、Eisai Inc.、Elan Pharmaceuticals, Inc.、Eli Lilly and Company、EuroImmun、F. ホフマン・ラ・ロシュ社およびその関連会社ジェネンテック社、富士レビオ社、GEヘルスケア社、IXICO社、ヤンセン・アルツハイマー免疫療法研究開発社、ジョンソン・エンド・ジョンソン製薬研究開発社、Lumosity社、ルンドベック社、Merck & Co、 Inc.、Meso Scale Diagnostics, LLC、NeuroRx Research、Neurotrack Technologies、Novartis Pharmaceuticals Corporation、Pfizer Inc.、Piramal Imaging、Servier、武田薬品工業、Transition Therapeutics。カナダ保健研究所(Canadian Institutes of Health Research)は、カナダにおけるADNI臨床施設を支援するための資金を提供している。民間からの拠出は、Foundation for the National Institutes of Health (www.fnih.org)によって促進されている。助成団体はNorthern California Institute for Research and Educationであり、本研究は南カリフォルニア大学のAlzheimer's Therapeutic Research Instituteがコーディネートしている。ADNIのデータは南カリフォルニア大学のLaboratory for Neuro Imagingによって配布される。UCSDアカデミックセネート研究/ブリッジグラント。ユニス・ケネディ・シュライバー国立小児保健・人間発達研究所K12-HD000850。

著者情報
著者メモ
これらの著者は同等に貢献した: Julia M. Gauglitz、Kiana A. West、Wout Bittremieux。

著者および所属
カリフォルニア大学サンディエゴ校共同質量分析イノベーションセンター(米国カリフォルニア州ラホヤ

Julia M. Gauglitz, Kiana A. West, Wout Bittremieux, Kelly C. Weldon, Morgan Panitchpakdi, Francesca Di Ottavio, Christine M. Aceves, Nicole C. Sikora, Alan K. Jarmusch, Michael J. Meehan, Kathleen Dorrestein, Fernando Vargas, Katharina Spengler, Emmanuel O. Elijah, Mingxun Wang, Robert H. Mills & Pieter C. Dorrestein

カリフォルニア大学サンディエゴ校スカッグス薬学部、ラホヤ、カリフォルニア州、米国

Julia M. Gauglitz, Kiana A. West, Wout Bittremieux, Kelly C. Weldon, Morgan Panitchpakdi, Christine M. Aceves, Elizabeth Brown, Nicole C. Sikora, Alan K. Jarmusch, Anupriya Tripathi, Michael J. Meehan, Kathleen Dorrestein, Fernando Vargas, Emmanuel O. Elijah, Mingxun Wang, Robert H. Mills & Pieter C. Dorrestein

ベックマン保全研究センター、サンディエゴ動物園ワイルドライフ・アライアンス、エスコンディード、カリフォルニア州、USA

キャンディス・L・ウィリアムズ

カリフォルニア大学サンディエゴ校ジョーン&アーウィン・ジェイコブズ工学部マイクロバイオームイノベーションセンター(米国カリフォルニア州ラホヤ

ケリー・C・ウェルドン、キャメロン・マルティーノ、ペドロ・ベルダ・フェレ、オースティン・D・スワフォード、ロブ・ナイト、ピーテル・C・ドーレスタイン

カリフォルニア大学サンディエゴ校(米国カリフォルニア州ラホヤ)生物科学部門

エリザベス・ブラウン、アヌプリヤ・トリパティ、フェルナンド・バルガス、レイチェル・J・ダットン

カリフォルニア大学サンディエゴ校医学部小児科、カリフォルニア州ラホヤ、USA

Cameron Martino、Anupriya Tripathi、Justin P. Shaffer、Lindsay DeRight Goldasich、Tara Schwartz、MacKenzie Bryant、Gregory Humphrey、Pedro Belda-Ferre、Edgar Diaz、Daniel McDonald、Qiyun Zhu、Clarisse Marotz、Gail Ackermann、Robert H. Mills、Megan M. Doty、Kyung E. Rhee、Rob Knight、Pieter C. Dorrestein

カリフォルニア大学サンディエゴ校(米国カリフォルニア州ラホヤ)バイオインフォマティクス・システムバイオロジープログラム

キャメロン・マルティーノ

カリフォルニア大学サンディエゴ校(米国カリフォルニア州ラホヤ)医学部リウマチ・アレルギー・免疫部門

ロクサーナ・コラス、ロバート・ターケルタブ、モニカ・グーマ

米国ミネソタ州ミネアポリス、ミネソタ大学公衆衛生学部疫学・地域保健学科

アビゲイル・J・ジョンソン

コロラド大学ボルダー校統合生理学教室(米国コロラド州ボルダー

ケイト・E・スプレッチャー、ダナ・ウィズロー、ケネス・P・ライト・ジュニア

米国ウィスコンシン州マディソン、ウィスコンシン大学人口健康科学部

ケイト・E・スプレッチャー

ベネズエラ、アマゾナス州プエルト・アヤクチョ、シモン・ボリバル熱帯病研究・制御アマゾン自治センター

ダニエラ・バルガス=ロブレス

米国マサチューセッツ州ビリングズ、ビリングズ・クリニック小児科

ルルデス・エレーラ

米国ミシガン州イーストランシング、ミシガン州立大学動物科学部

バリー・J・ブラッドフォード

サンパウロ大学炎症性疾患研究センター、リベイラン・プレット薬学部、薬理学科、ブラジル、サンパウロ州リベイラン・プレット

ルーカス・マキエル・マウリズ・マルケス、フラビオ・プロタシオ・ヴェラス、チアゴ・マタル・クーニャ

バイーア連邦大学学際保健研究所(ブラジル、バイーア州ビトリア・ダ・コンキスタ

ジュリアーノ・ジェラルド・アマラル

サンパウロ大学リベイラン・プレット薬学部生体分子科学科NPPNS(ブラジル、サンパウロ、リベイラン・プレット

ロドリゴ・モレイラ・シルヴァ&ノルベルト・ペポリン・ロペス

サンパウロ大学リベイラン・プレット医学部内科、炎症性疾患研究センター、ブラジル、サンパウロ、リベイラン・プレット

レネ・ドニゼティ・リベイロ・オリヴェイラ&パウロ・ルザーダ=ジュニオール

カリフォルニア大学サンディエゴ校薬理学教室(米国カリフォルニア州ラホヤ

ロバート・H・ミルズ & ピーテル・C・ドーレスタイン

米国国立標準技術研究所物質測定研究所(メリーランド州ゲイサーズバーグ

パウリナ・K・ピオトロウスキー、ステファニー・L・セルベタス、サンドラ・M・ダ・シルバ、クリスティーナ・M・ジョーンズ、ナンシー・J・リン、カトリス・A・リッパ、スコット・A・ジャクソン

米国ノースカロライナ州ダーラム、デューク大学医学部精神医学・行動科学科

リマ・カドゥラー・ダウク

米国ノースカロライナ州ダーラム、デューク大学医学部

リマ・カドゥラー・ダオーク

デューク大学脳科学研究所(米国ノースカロライナ州ダーラム

リマ・カドゥラー・ダウク

カリフォルニア大学サンディエゴ校神経科学科(米国カリフォルニア州ラホヤ

ダグラス・ガラスコ

米国カリフォルニア州ラホヤ、カリフォルニア大学サンディエゴ校、医学部消化器科

パランビール・S・ドゥライ、ブリギッド・S・ボランド

米国カリフォルニア州ラホヤ、スクリプス研究所分子医学部門

タチアナ・I・カラシニコワ&カート・ウィッテンバーグ

サンディエゴVAヘルスケアシステム(米国カリフォルニア州サンディエゴ

ロバート・ターケルタブ

米国ハワイ州ホノルル、ジョン・A・バーンズ医科大学、カピオラニ・メディカル・センター、小児科、新生児学部門

ミーガン・M・ドティ

シンシナティ小児病院メディカルセンター、シンシナティ大学医学部、小児科、周産期研究所、新生児学部門、米国オハイオ州シンシナティ

ジェ・キム

米国カリフォルニア大学サンディエゴ校ラホヤ校小児科病院医学部門

Julia Beauchamp-Walters

米国ニュージャージー州ニューブランズウィック、ニュージャージー州立大学ラトガース校環境・生物科学部生化学・微生物学科

マリア・グロリア・ドミンゲス・ベロ

米国ミズーリ州セントルイス、ワシントン大学小児科

マーク・マナリー

カリフォルニア大学サンディエゴ校医学部(米国カリフォルニア州ラホヤ

ミチェリ・F. オリヴェイラ&ロブ・ナイト

米国カリフォルニア州ラホヤ、カリフォルニア大学サンディエゴ校 コンピュータ科学・工学部

ロブ・ナイト

米国カリフォルニア州ラホヤ、カリフォルニア大学サンディエゴ校バイオエンジニアリング学科

ロブ・ナイト

貢献
P.C.D.、R.K.D.、R.J.D.、J.M.G.が構想を練った。M.J.M.、M.B.、M.P.、F.D.O.、K.C.W.、C.M.A.、E.B.、K.S.、P.C.D.、R.J.D.、R.K.D.、N.C.S.、A.D.S.、K.D、 G.A.、D.M.D.、N.P.L.、M.B.、J.M.G.がFoodOmicsサンプルの収集とメタデータのキュレーションを実施した。M.J.M.、M.P.、F.D.O.、F.V.、C.M.A.、E.B.、N.C.S.、および J.M.G. が FoodOmics サンプルの処理と MS データの取得を実施した。A.J.J.、P.B.F.、E.D.、Q.Z.、D.N.、D.M.、J.P.S.、および J.M.G.が、FoodOmics のメタデータを FNDDS と一致させるために Global FoodOmics メタデータのキュレーションを行った。K.E.R., J.B.W., B.S.B., B.J.B., R.C., M.G.D.B., M.M.D., E.O.E., D.G., L.H., J.H.K., M.M., C.M., R.K., K.E.S., D.V.R., T.I.K., C.W., K.P.W.J., M.F.O., R.H.M., D.W., R.T., J.G.A., P.S.D., M.G., D.J.G、 A.K.J.、B.J.B.、R.M.S.、K.C.W.、A.D.S.、F.V.、N.P.L.、P.K.P.、S.M.D.S.、S.L.S.、C.M.J.、N.J.L.、K.A.L.、S.A.J.、R.K.D.、J.M.G.はサンプル、比較データセット、および/または詳細なメタデータを提供した。L.M.M.M.、T.M.C.はCOVID-19患者および/または食品サンプルの調製と分析を行った。P.L.J.はCOVID-19患者の担当医師であった。R.D.R.O.はCOVID-19患者からの血漿採取の責任医師であった。F.P.V.はCOVID-19患者データの集計を担当した。M.P.、J.M.G.、T.S.、M.G.D.B.、L.D.R.G.、G.H.は食品サンプルを調製した。M.W.は本研究で使用したGNPS計算インフラをサポートした。C.L.W.、W.B.、A.K.J.、K.A.W.、E.S.、A.T.、N.P.L.、J.M.G.はMSデータの解析を行った。C.L.W.、W.B.、A.K.J.、K.A.W.、C.M.、J.M.G.が図を作成。P.C.D.、R.K.、R.J.D.、A.D.S.、J.M.G.が監修。P.C.D.、R.K.、C.L.W.、K.A.W.、W.B.、J.M.G.が論文を執筆した。すべての著者が原稿にフィードバックと編集を寄せた。

対応する著者
Rob KnightまたはPieter C. Dorresteinまで。

倫理申告
競合利益
B.S.B.はPrometheus Biosciences社から研究助成金を得ており、Pfizer社からコンサルティング料を受け取っている。P.C.D.は、Sirenas社、Cybele Microbiome社、Galileo社の科学顧問であり、Ometa Labs LLC社およびEnveda社(カリフォルニア大学サンディエゴ校の承認を得ている)の創設者兼科学顧問である。J.H.K.はMedela社のコンサルタント、Innara Health社の取締役を務め、Astarte Medical社とNicolette社の株式を保有している。M.G.はファイザーとノバルティスから研究助成を受けている。P.S.D.は武田薬品、ファイザー、アッヴィ、ヤンセン、プロメテウス、ブールマン、ポリメトコから研究支援および/またはコンサルティングを受けている。R.J.D.は、Impossible Foods Inc.のコンサルタントであり、同社株式を所有。A.J.J.はアボットニュートリション社およびコアバイオーム社からコンサルティング料を受領。D.G.はBiogen社、Fujirebio社、vTv Therapeutics社、Esai社、Amprion社のコンサルタントであり、Cognition Therapeutics社のDSMB委員を務めている。K.P.W.は、本試験実施中にSomaLogic, Inc.から研究支援を受け、Sleep Disorders Research Advisory Board-National Heart, Lung and Blood Institute, CurAegis Technologies, Philips, Inc. R.T.は、AstraZeneca Consulting、SOBI、Selecta、Horizon、Allena、AstraZenecaから研究助成を受けた。A.D.S.とR.K.はUC San DiegoのCenter for Microbiome Innovationのディレクターであり、複数のマイクロバイオーム・イニシアチブのために産業界から研究資金を受けているが、このプロジェクトには産業界からの資金提供はなかった。R.K.はBiomeSense, Inc.の科学諮問委員会メンバー、コンサルタントであり、株式を保有し、収入を得ている。この取り決めの条件は、カリフォルニア大学サンディエゴ校の利益相反ポリシーに従って検討され、承認されている。M.W.はOmeta Labs LLCの共同設立者。K.D.は、中枢神経系疾患の診断および治療におけるメタボロミクスの利用に関する一連の特許の発明者であり、Metabolon Inc.、Chymia LLCおよびPsyProtixの株式を保有している。残りの著者は、競合する利益はないと宣言している。

査読
査読情報
Nature Biotechnology誌は、Elaine Holmes氏と、この論文の査読に貢献した他の匿名の査読者に感謝する。

その他の情報
出版社注:Springer Natureは、出版された地図の管轄権の主張および所属機関に関して中立を保っている。

補足情報
補足情報
補足図1-3.

報告概要
補足表1
フードミクスプロジェクトのメタデータ表

補足表2
28の公開プロジェクトそれぞれの研究詳細の表

権利と許諾
シュプリンガー・ネイチャー社またはそのライセンサー(学会またはその他のパートナーなど)は、著者またはその他の権利者との出版契約に基づき、本論文の独占的権利を有する。本論文の受理された原稿版の著者によるセルフアーカイビングは、かかる出版契約の条件および適用法のみに従う。

転載と許可

この記事について
更新を確認する CrossMarkで最新性と真正性を確認する
この記事の引用
Gauglitz, J.M., West, K.A., Bittremieux, W. et al. メタデータベースのソースアノテーションを用いたアンターゲットメタボロミクスの強化. Nat Biotechnol 40, 1774-1779 (2022). https://doi.org/10.1038/s41587-022-01368-1

引用文献のダウンロード

受領
2021年6月24日

受理
2022年5月20日

出版
2022年07月07日

発行日
2022年12月

DOI
https://doi.org/10.1038/s41587-022-01368-1

この記事を共有する
以下のリンクをシェアすると、誰でもこのコンテンツを読むことができます:

共有可能なリンクを取得
コンテンツ共有イニシアチブSpringer Nature SharedItにより提供されています。

対象
データ処理
データベース
質量分析
メタボロミクス
この論文の引用元
過酸化水素およびペルオキシモノサルフェート処理による着色歯の分子変化の生体外研究
Paulo Wender P. GomesSimone ZuffaPieter C. Dorrestein
サイエンティフィック・リポーツ (2023)

実験的シャーガス病における心筋小分子の局在と持続的な化学的後遺症
リウ・ゾンユアンRebecca Ulrich vonBargenLaura-Isobel McCall
ネイチャー・コミュニケーションズ (2023)

東アジア伝統医療に用いられる薬用植物の特殊メタボロームに関する質量分析データ
姜京彬鄭婉夏申相姫
科学データ(2022)

メタボロミクスコミュニティの知識を取り込むためにスペクトルライブラリが果たす重要な役割
Wout BittremieuxMingxun WangPieter C. Dorrestein
メタボロミクス(2022)

ネイチャーバイオテクノロジー (Nat Biotechnol) ISSN 1546-1696 (online) ISSN 1087-0156 (print)

サイトマップ
ネイチャー・ポートフォリオについて
ネイチャーについて
プレスリリース
プレスオフィス
お問い合わせ
コンテンツを見る
ジャーナルA-Z
テーマ別記事
プロトコル交換
ネイチャー・インデックス
出版ポリシー
Natureポートフォリオポリシー
オープンアクセス
著者・研究者サービス
別刷りと許可
研究データ
言語編集
科学編集
ネイチャー・マスタークラス
エキスパートトレーナーによるワークショップ
研究ソリューション
図書館・機関
図書館員サービス&ツール
図書館ポータル
オープンリサーチ
図書館への推薦
広告とパートナーシップ
広告
パートナーシップとサービス
メディアキット
ブランドコンテンツ
プロフェッショナル育成
ネイチャー・キャリア
ネイチャーコンファレンス
地域ウェブサイト
ネイチャー・アフリカ
ネイチャー・チャイナ
ネイチャー インド
ネイチャー・イタリア
日本のネイチャー
ネイチャー 韓国
ネイチャー 中東
プライバシーポリシー クッキーの使用 お客様のプライバシーに関する選択/クッキーの管理 法的通知 アクセシビリティに関する声明 利用規約 お客様の米国におけるプライバシー権
シュプリンガー・ネイチャー
© 2024 シュプリンガー・ネイチャー

閉じる
トランスレーショナルリサーチの最新情報を毎週お届けします。
Nature Briefingに登録する: トランスレーショナルリサーチ

この記事が気に入ったらサポートをしてみませんか?