見出し画像

ChEMBL(ケンブル)のおさらいをしてみます

Teach Open CADDに関して説明する前に、ChEMBLのおさらいから始めます。どうしてかというと、Teach Open CADDのKNIME workflow(WF)は一番最初にChEMBL IDを入力する必要があるからです。

画像1



つまりターゲットのChEMBL IDを指定できないとこのWFを十分に使えません。
私としては、「ChEMBLは使ったことないなぁ」って方にも興味を持ってもらいたいと思うのです。

ChEMBL(ケンブル)、ケモインフォマティクスをするなら必ずお世話になります。一方、創薬化学者として自分の担当プロジェクトの化合物群のSARばかリ追っていると、意外に社外データを自分で入手することがなく、「けんぶる?名前は聞いたことあります」ってなったりします。もちろんそうでない方も多いですから、以下は必要に応じて読んでください。

そもそものChEMBLの説明は、池田先生の下記資料に詳しいです。
https://cbi-society.org/home/documents/seminar/2009to12/CBI_Ikeda_511_d.pdf
ググっても、Wikiでも十分日本語で情報が得られます。
ものすごく簡潔に紹介すると、創薬化学に関する論文から、創薬ターゲットや低分子化合物の活性データなど、創薬研究に役立つデータを抽出してデータベースを構築し、無料で利用できる環境を提供してくれています。
さて、その利用法についてはにわさんのブログがわかりやすいので紹介しておきます。
https://aimedchem.hatenablog.com/entry/2020/10/01/000645
あまりに分かりやすくて私は何を書けばいいのだろうと思いましたが、今回の目的である、Target ChEMBL IDを実際にとって来る操作を記録してみました。
にわさんの例と同様に、

アルツハイマー病治療薬であるドネペジルのターゲットでもあるアセチルコリンエステラーぜ(AChE)を例に、

ChEMBLでターゲット"AChE"のIDを探してみましょう。

画像2

①ChEMBLのホームページにアクセスし、
https://www.ebi.ac.uk/chembl/
上図のように検索窓にターゲット名を入れてリターンキーを押せば検索開始。
有名なものなら上記のように、略号でもヒットします。

②検索結果は複数あるので、さらに自分の目的に照らして狙いを絞ります。
2021年7月時点ではターゲットとして20種のヒットがあるようです。

画像3

上図の「Target」(黄色で色塗り表示)タブをクリックすると、20種のターゲットを一覧表で閲覧できます。

③20種もあるといろいろ迷うでしょうけれど、今回はTypeはSingle Protein, Organismはヒト(Homo sapiens)で7992化合物もデータが収載されているので、十分なデータ量と見込んでこちらだけを取得とします。
選び方は利用目的や欲しいデータ数なども加味してその都度考えて選ぶしかないです。

画像4

結果として、今回必要なTarget ChEMBL IDは「ChEMBL220」と決定しました。

もしご自身の興味があるターゲットで調査して困った場合は、周りの詳しい方を探して相談が一番有用です。本当に困った場合はこの記事にコメントで相談してみてください。微力ながら一緒に悩むくらいは出来ます。

さて、次はいよいよKNIMEを利用してTeach Open CADDのWFを利用開始したいと思います。
一応確認ですけど、KNIMEはインストールされてますよね?
もしまだならInfocom社の公式導入ガイドをどうぞ!
https://knime-infocom.jp/service/knime-analytics-platform/guide/download/
さすがにもう加えるコメントなど何もございません。

この記事が参加している募集

記事を読んでいただきありがとうございます。 先人の智慧をお借りしつつ、みなさんに役立つ情報が届けられたらと願っています。 もしサポートいただけるなら、そのお金はKNIMEの無料勉強会の開催資金に充てようと思います。