【W8】タンパク質データの取得_11_Step3_最終工程
【W8の目的とStep3概要】
Python版はより発展的です。
上記の(ii)を実行中。デモデータを使ってW8のStep2を学びました。
出力は下記のようなデータテーブルです。
今回から最終工程のStep3。
「最も質の良い4つのタンパク質ーリガンド複合体構造」すなわち解像度順でTop 4に絞って共結晶のデータを取得します。
上位4つに絞るのですが、同スコアで4位が3つあるうち、3POZだけが残りますね。
PDBからデータが入手できた順(Row ID)に並ぶので、PDB_IDの小さいデータすなわち大まかにいえばより古いPDBデータが上に来るのではと推測します。
【PDBデータ取得】
【Row Filter】
設定:
結果:
先述の通り4レコードに絞りました。
【PDB Downloader】
日本語化されたディスクリプションを一部引用して少し加筆し説明とします。
このマニアックなノードまで作成し解説もつけてくれるVernalis社と日本語訳して下さったInfocom社の尽力に再び感謝しつつ。
今回はPDB形式でデータを入手しますので下記の設定となります。
設定:
結果:
PDBの1セルに1つのPDBデータが入っているのでかなりの情報量です。
その中身の説明をしだしたらそれだけで1章分になりますので割愛しますが、下記の記事などとても参考になるでしょう。Magattacaさんは本当に素晴らしい!
【String Manipulation】
pdb_filenameというカラムを新たに作り、今回の各PDBファイルの保存名を定めています。
設定:
結果:
このデータテーブルはW8のメタノードの出力にもなっています。
すなわち上記の出力ポートも全く同じ内容です。
【PDB Saver】
日本語化されたディスクリプションを一部引用して少し加筆し説明とします。
設定:
“Save all files in parent folder”にチェックが入っていて、デモデータでは相対パスで保存先が指定されています。
結果:
Trueすなわち書き込み成功です。さて、どこに保存されているかというと、皆さんのKNIME APのknime-workspaceフォルダを探してください。
相対パスに関してはまっきーさんのブログを引用しておきますね。
最後にもう一つ
デモデータでは上記の場所にファイルを書き込みますが、皆さんが利用される際は各自で適切なフォルダを指定した方がいいでしょう。そんなことまで丁寧にworkflow内にコメントしてくれているTOCの設計者の方々。
最後の最後まで至れり尽くせりの配慮にあらためて最大限の謝意を示して、私も筆をおこうと思います。
TeachOpenCADDは本当に素晴らしいケモインフォマティクス教材です!
本当に本当にありがとう!!
記事を読んでいただきありがとうございます。 先人の智慧をお借りしつつ、みなさんに役立つ情報が届けられたらと願っています。 もしサポートいただけるなら、そのお金はKNIMEの無料勉強会の開催資金に充てようと思います。