hiratomoko

Pythonでインフォマティクス

MATCHA:多段階フローマッチングで分子ドッキングの物理的妥当性を改善する

タンパク質と小分子(リガンド)がどのように結合するか、または結合しないのか、正確に予測(ドッキング予測)することができれば、様々な応用が可能です。近年、DiffDock1に代表される拡散モデル(diffusion model)ベースの手法が...
Rでデータ解析と可視化

Rで群集構造解析 最新論文に学ぶNMDS・PERMANOVA・SIMPERの実践フロー

微生物生態学や環境科学において、調査地点や処理区などの「グループ間で生物コミュニティに違いがあるか」を明らかにすることは、解析の最も重要な第一歩です。以前、NMDSについてご紹介しました。前回の記事ではNMDSの図を描くことに焦点を当てまし...
Pythonでインフォマティクス

PPIFlow:フローマッチングとIn Silico成熟化によるバインダー設計

深層学習を用いたタンパク質設計は、拡散モデル(Diffusion Models)により大きく前進しました。しかし、計算コストと生成精度は依然として課題です。また、計算機のみで高い結合親和性を持つバインダーを設計することは困難で、通常ウェット...
Pythonでインフォマティクス

天然変性領域の「分子グラマー」:NARDINI+とGINリソース

タンパク質科学において長らく信じられてきた「構造が機能を決定する」という定説は、21世紀に入り修正を迫られました。ヒトプロテオームの約30〜50%を占めると言われる 天然変性領域 (Intrinsically Disordered Regi...
Rでデータ解析と可視化

Rで傾向スコア・マッチング

新薬の効果検証や治療法の比較など、医学研究の分野において最も信頼性の高いエビデンスとされるのが、被験者をランダムに割り付けるランダム化比較試験(RCT)です。しかしながら、被験者の背景をランダムに割り付ける、ということは、倫理的な問題やコス...
Pythonでインフォマティクス

BoltzGenによるPFAS結合タンパク質の生成:環境技術への応用可能性

今回の記事では、タンパク質の全原子生成AIである BoltzGen を実際に実行してみました。BoltzGenのプレプリントとリポジトリでは、タンパク質に対するバインダーや抗体デザインなど、様々な実施例とその設定Yamlファイルが紹介されて...
Pythonでインフォマティクス

Profluent-E1 : タンパク質言語モデルの新基準

1. 研究の背景と目的:単一配列モデルから検索拡張へ 近年、凄まじい性能を見せている、生成AIのChatGPTやGeminiなどは、いわゆる大規模言語モデル(LLM: Large Language Model)として開発されてきました。LL...
Pythonでインフォマティクス

PTraj-Diff:タンパク質の動きを生成するAI

1. 研究の背景と目的近年のAlphaFold 21/32の登場は、タンパク質の「静的な3D構造」の高精度予測を可能にしました。しかし、タンパク質の機能は、その動き、すなわち「ダイナミクス」とも密接に関連しています。AlphaFoldの成功...
Pythonでインフォマティクス

抗体生成AI:配列ベースMAGE vs 構造ベース拡散モデルRFdiffusion-Ab(RFantibody)

1. 研究の背景と目的抗体医薬の標的をめぐるジレンマ免疫系が病原体などを認識する際、抗原の表面にある特定の目印を認識します。この免疫系が認識する最小単位(目印)をエピトープ(抗原決定基)と呼びます 。一方、抗体側がエピトープに結合するために...
Pythonでインフォマティクス

Boltz-2:リガンド結合親和性予測器を備えたタンパク質複合体構造予測モデル

1. 研究の背景と目的医薬品候補を設計する際、ターゲットとなるタンパク質や医薬候補リガンドの立体構造情報をベースにする手法を、Structure Based Drug Design(SBDD)と呼びます。ウェットな実験が当然必要となりますが...