【独習】深層学習GNNを利用した抗体デザインのいろは(RefineGNNの原理)

ページリンク

第5章 RefineGNNの原理

本章では、RefineGNN のコードの詳細について解説します。この章を通じて、タンパク質構造の1次的なデータから、どのように特徴量がエンジニアリングされ、アミノ酸配列や構造が生成されているのか、その解析原理を学ぶことが目標です。また実際のプログラムコードを理解することで、読者の皆様の目的にあったモデルが構築できるように、RefineGNN を改良することもできるようになるでしょう。

本章は、この目標に近づけるように以下の構成で、解説を進めます。

  • ネットワークアーキテクチャの解説(structgen/hierarchical.py)

  • 構造(座標)情報からノード・エッジ特徴量の生成原理の解説(structgen/protein_features.py)

まず、ネットワークの構成について学習することで、モデル全体のイメージができるようになりましょう。次に、特徴量エンジニアリングの中でも GNNに特徴的な、タンパク質構造からノードとエッジ情報を抽出する過程について学習します。このトピックでは、構造生物学の知識への理解を深めていくことが目標です。PDB に登録されたタンパク質の座標情報から、どのようにノードとエッジ情報へと加工されるか学ぶことは、タンパク質構造を扱う上で非常に重要な要素です。特徴量の抽出過程では、2面角や残基間の距離など、点群処理に必要な計算過程も学ぶことができます。

ここから先は

9,769字 / 4画像

¥ 500

この記事が気に入ったらサポートをしてみませんか?