書記のBio/Chem-Info日誌#18 化合物の味覚を機械学習で予測するツール
今回は,化合物の味覚を機械学習で予測するツールについていくつか紹介する。
創薬 (dry) Advent Calendar 2021参加記事
味覚とは何か
まずは味覚の概要について,以下レビュー論文より,ポイントを解説する。
・味覚を感知する解剖学的な単位は味覚受容体細胞(TRC)であり,舌や口蓋上皮の様々な乳頭に分布する味蕾に集められる
・味蕾に存在するTRCには,形態的に異なる3つのサブタイプがあり人間が感じるさまざまな味を感知する;タイプIのグリア様細胞は塩味を感知し,タイプIIのGPCRを発現する細胞は甘味,うま味,苦味を感知する,タイプIIIの細胞は酸味の刺激を感知する
・甘味とうま味の刺激はタイプ1の味覚GPCRによって伝達され,苦味はタイプ2の味覚GPCRによって感知される
・また,最近注目されているコクミの感覚は,もう一つのGPCRであるカルシウム感知受容体(CaSR)が担っている
BitterSweetForest(2018)
ポイント
・この研究の目的は,分子の甘味と苦味を識別するために,分子指紋に基づいた機械学習モデルを開発し,検証することである
・BitterSweetForestは,KNIMEワークフローに基づいた初のオープンアクセスモデルであり,フィンガープリントとランダムフォレストベースの分類法を用いて,化学物質の苦味と甘味を予測するプラットフォームを提供する
・構築されたモデルは,クロスバリデーションにおいて95%の精度と0.98のAUCを達成した
・また,独立したテストセットにおいて,BitterSweetForestは,苦味と甘味の予測において96%の精度と0.98のAUCを達成した
・構築されたモデルはさらに,天然化合物,承認薬および急性毒性化合物データセットの苦味と甘味の予測に適用された
VirtualTaste(2021)
ポイント:
・本研究では,甘味,苦味,酸味という3つの異なる味覚エンドポイントを予測する機械学習モデルを実装した
・VirtualTasteモデルは,10倍のクロスバリデーションと独立したテストセットにおいて,総合的な精度90%,AUC0.98を達成した
・このウェブサーバーは,2次元の化学構造を入力とし,3つの味に対する化学物質の味のプロファイルを報告する
・これには,分子のフィンガープリントと,トレーニングセットからの既知の活性を持つ類似化合物の情報を含む信頼度スコアおよび全体のレーダーチャートが含まれる
・さらに,予測された苦味化合物のターゲット予測により,25の苦味受容体に関する洞察も提供される
・VirtualTasteは,我々の知る限り,3つの異なる味の化合物を予測するための,自由に利用できる初めてのウェブベースのプラットフォームである
VirtualTasteを使ってみる
まずは苦い医薬品の代表であるClarithromycinを投げてみる。
ここからが結果,まずは分子の情報について。
ここで味があるかどうかが示される。Clarithromycinの場合,強い苦味が予測された。
ちなみに,添付文書「有効成分に関する理化学的知見」の欄でも,味は苦いと書かれている。Clarithromycinは特に小児科で抗生物質として頻用され,その苦味はコンプライアンスの問題を引き起こすために,メーカー側がさまざまな製剤的な工夫(顆粒やドライシロップなど)を凝らしている。
次に,天然の甘味料に用いられる甘草の主成分,Glycyrrhizic acidを投げる。
強い甘味のみが予測された。
ここで,アグリコンであるGlycyrrhetinic acidも見てみる。
強い甘味の他に,弱い苦味が予測された。
ちなみに甘草は,海外ではリコリスとしてお菓子に用いられてたりするのだが,じんわりくる甘味とベタつく苦味で脳が拒否しそうな組み合わせである。実際の甘草も,甘味よりも苦味の方が印象的であった。
筆者の印象(まとめ)
・味覚については不明なことも多く,GPCRが関与しているということで余計複雑怪奇になっている
・味覚は,生物の進化の過程で残ったフィルターであり,甘味の検知はエネルギー摂取,苦味の検知は毒の回避などに機能していると考えられる
・医薬品を考える上では,経口投与の薬剤では苦味がコンプライアンス低下(特に小児)に繋がる可能性があることから,苦味の有無を知る動機は十分にある
・また,苦味健胃をはじめとして苦味は薬効に直結していることから,GPCRへの作用を考えるのは自然なことだろう
・本当は分子ドッキングとかで結合様式を観察すればいいのだろうが,GPCRの結晶構造の報告は少ない,また類似性が低いことからホモロジーモデリングも厳しい,MDはより正確だが時間がかかる
・複合体は難しいので,とりあえず化合物のみ見てその傾向を捉えるのが現状での近似解か
・化合物を分類するにはフィンガープリントが取得できればよく,これはRDkitとかKNIMEを使えば割と手軽にできる気がする(機械学習の問題としてはそんなに難しくないはず)
・肝となるのは分類の基準で,研究者の関心により個性が分かれそうなポイント
参考文献
Ahmad R, Dalziel JE. G protein-coupled receptors in taste physiology and pharmacology. Front Pharmacol. 2020;11:587664.
Banerjee P, Preissner R. Bittersweetforest: a random forest based binary classifier to predict bitterness and sweetness of chemical compounds. Front Chem. 2018;6:93.
Fritz F, Preissner R, Banerjee P. VirtualTaste: a web server for the prediction of organoleptic properties of chemical compounds. Nucleic Acids Research. 2021;49(W1):W679-W684.
本記事のもくじはこちら: