最近の記事

The GFlowNet Tutorial

https://www.notion.so/The-GFlowNet-Tutorial-91e9df40393443ff9bfa93018fa7847d The GistGFlowNetは、構成的なステップのシーケンスを通じてオブジェクトxをサンプリングするように訓練された、訓練済み確率的方策、すなわち生成モデルです。その確率は、報酬関数R(x)に比例します。ここで、Rは非負の積分可能な関数です。これにより、GFlowNetは、高い値のR(x)を持つ多様な解xをサンプリング

    • 3DREACT

      You: これから、英語論文のテキストを入力します。これを読み込み、この論文の内容について、日本語で詳しく説明してください。 (省略) Gemini:3DReact: 化学反応の幾何学的深層学習この論文は、化学反応の性質を3次元構造から予測するための幾何学的深層学習モデルである 3DReact を紹介しています。分子構造の対称性をニューラルネットワークアーキテクチャに組み込む幾何学的深層学習モデルは、分子特性の予測において、精度とデータ効率を大幅に向上させてきました。3DR

      • ClipCap: CLIP Prefix for Image Captioning

        SUMMARYCLIPとGPT-2という事前学習済みの強力なモデルを活用し、それらを繋ぐシンプルなマッピングネットワークのみを学習させるアプローチを提案しています。 CLIPの画像エンコーディングを入力として受け取り、キャプションの先頭に付加するプレフィックス埋め込みを生成するマッピングネットワークを学習させます。 言語モデル(GPT-2)はプレフィックスを受け取ってキャプションを生成します。言語モデルはファインチューニングする場合としない場合の2つのバリエーションを提案

        • COATI: Multimodal Contrastive Pretraining for Representing andTraversing Chemical Space

          SUMMARYこの論文は、Terray Therapeutics社の研究者らによる「COATI: Multimodal Contrastive Pretraining for Representing and Traversing Chemical Space」という題の研究を報告しています。主な内容は以下の通りです: COATIモデルの提案: 分子構造を表現するための新しいマルチモーダルな対照学習モデル 2D(SMILES文字列)と3D(点群)の分子表現を同時に学習

        The GFlowNet Tutorial

          IEV2Mol: Molecular Generative Model Considering Protein-Ligand Interaction Energy Vector

          SummaryIEV2Mol: タンパク質-リガンド相互作用エネルギーベクトルを用いた新規化合物生成モデル論文の概要 本論文では、IEV2Mol という新しい深層学習ベースの分子生成モデルが提案されています。IEV2Molは、**タンパク質-リガンド相互作用エネルギーベクトル(IEV)**を用いることで、標的タンパク質との結合親和性が高いと予測される新規化合物を設計することを目的としています。従来の分子生成モデルは、主に化合物の構造的特徴に焦点を当てていましたが、IEV2M

          IEV2Mol: Molecular Generative Model Considering Protein-Ligand Interaction Energy Vector

          Protein Structure-Based Organic Chemistry-Driven Ligand Design from Ultralarge Chemical Spaces

          超巨大ケミカルスペースからのタンパク質構造ベースの有機化学駆動リガンド設計 要約 数十億もの化合物を網羅した超巨大ケミカルスペースは、創薬初期段階におけるヒット同定に革命をもたらしています。その規模の大きさから、このようなケミカルスペースを完全に列挙することは不可能であり、潜在的に興味深いヒットを探索し、選択するためには、アドホックな計算ツールが必要となります。本稿では、市販の化学試薬を対象となる標的にまずドッキングさせ、次に有機化学およびトポロジーの規則に従って直接結合

          Protein Structure-Based Organic Chemistry-Driven Ligand Design from Ultralarge Chemical Spaces

          Incorporating Synthetic Accessibility in Drug Design: Predicting Reaction Yields of Suzuki Cross-Couplings by Leveraging AbbVie’s 15-Year Parallel Library Data Set

          Summaryこの論文は、AbbVie社の15年間にわたる医薬品開発のための並列合成ライブラリーのデータセットを用いて、機械学習により鈴木カップリング反応の収率を予測するモデルを構築した研究です。 医薬品開発では、多数の化合物を合成し評価する必要があり、合成の効率化が重要な課題です。特に並列合成ライブラリーは構造活性相関の探索に有用ですが、収率予測は考慮されていませんでした。著者らは、AbbVie社の大規模な並列合成データに着目し、機械学習による収率予測モデル構築を目指しま

          Incorporating Synthetic Accessibility in Drug Design: Predicting Reaction Yields of Suzuki Cross-Couplings by Leveraging AbbVie’s 15-Year Parallel Library Data Set

          Protein Structure-Based Organic Chemistry-Driven Ligand Design from Ultralarge Chemical Spaces

          https://pubs.acs.org/doi/10.1021/acscentsci.3c01521 Summaryこの論文は、超大規模化学空間から、有機化学の知見を活用してタンパク質の立体構造に基づくリガンド設計を行う新しいアプローチ「SpaceDock」を提案しています。 近年、数十億もの化合物を含む超大規模化学空間が創薬の初期段階でのヒット同定を大きく変えつつあります。しかしその膨大なサイズゆえに、化学空間全体を列挙することができず、その中を探索しヒット化合物を選

          Protein Structure-Based Organic Chemistry-Driven Ligand Design from Ultralarge Chemical Spaces

          退職&D進をキメました

          2022年3月に会社を退職して4月から博士後期課程に進学しました。いわゆる退職D進というやつですが、当然情報が少ないのでTips的なものを書いておこうと思います。 ちなみに私は有機合成(反応開発)出身で、一度メーカーに就職しましたが、cheminformatics がやりたくて進学しました。 このnoteのせいでそっこう身バレしてハズかったので1年間は100円の活性化エネルギーを設けていましたが、最近どうでもよくなってきたので普通に公開しています。買ってくれた方と投げ銭してく

          退職&D進をキメました