LightDockのインストール:タンパク質のドッキングシミュレーション

Pythonでインフォマティクス
  このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介していきたいと考えています。Python は3系(3.7)、anacondaを中心にして環境構築していきます。以下のようなハード・ソフト環境(CentOS Linux)を用いますが、Python(anaconda)が利用できれば、異なる環境下でも類似の実装が可能かと思います。
  • CPU Intel® Core™ i7-6700K CPU @ 4.00GHz × 8
  • メモリ  64GB
  • GPU GeForce GTX 1080/PCIe/SSE2
  • OS  CentOS Linux 8
  • Python 3.7

前回の記事では、タンパク質の形(立体構造)を表示・分析するためのソフトフェアとしてPyMOLを導入しました。タンパク質は形に応じて様々な機能を発揮しますが、その際に、形に応じて様々な分子と結合(相互作用)します。例えば、酵素タンパク質はその形に応じて反応物(基質)を結合します。また、複数のタンパク質群がそれぞの形に応じて、相互に結合し合うことで、細胞内でより大きな構造体が形成されます。このようなタンパク質と他の分子間、およびタンパク質分子間の相互作用を推測する手法として、パソコン上でのドッキングシミュレーションを実施することが可能です。

LightDock のインストール

ドッキングシミュレーションをパソコン上で実行するために、AutoDock, Gold, Glideなど、無償・有償の多くのソフトウェアが開発されています。この記事では、比較的新しく、またPythonパッケージとしての導入が可能な、 “LightDock” を紹介します。LightDock を使うことで、Glowworm Swarm Optimization (GSO)アルゴリズムに基づいたタンパク質-タンパク質間、タンパク質-ペプチド間、タンパク質-DNA間のドッキングシミュレーションを実行することができます。 前回前々回の記事のように、環境構築を進めますが、今回は、condaと並ぶ(condaより老舗の)Pythonパッケージ管理プログラムである pip も使用します。

LightDock” の詳細については、文末の論文1, 2を参照してください。論文の中身についても、今後紹介したいと考えています。

まずは、以下のコマンドで、仮想環境 LightDockを作成します。

$ conda create -n LightDock python=3.7

y を入力して、完了してください。

その後、conda activate LightDock を実行して、環境 LightDockをアクティブにしてください。その状態で、conda list を実行すると、

(LightDock) [xxxx@localhost ~]$ conda list
# packages in environment at /home/xxxx/anaconda3/envs/LightDock:
#
# Name                    Version                   Build  Channel
_libgcc_mutex             0.1                        main  
ca-certificates           2021.1.19            h06a4308_0  
certifi                   2020.12.5        py37h06a4308_0  
ld_impl_linux-64          2.33.1               h53a641e_7  
libedit                   3.1.20191231         h14c3975_1  
libffi                    3.3                  he6710b0_2  
libgcc-ng                 9.1.0                hdf63c60_0  
libstdcxx-ng              9.1.0                hdf63c60_0  
ncurses                   6.2                  he6710b0_1  
openssl                   1.1.1j               h27cfd23_0  
pip                       21.0.1           py37h06a4308_0  
python                    3.7.9                h7579374_0  
readline                  8.1                  h27cfd23_0  
setuptools                52.0.0           py37h06a4308_0  
sqlite                    3.33.0               h62c20be_0  
tk                        8.6.10               hbc83047_0  
wheel                     0.36.2             pyhd3eb1b0_0  
xz                        5.2.5                h7b6447c_0  
zlib                      1.2.11               h7b6447c_3  

と表示されたと思います。このなかに、パッケージ pip があることがわかると思います。pip が見当たらない場合には、conda install pip でインストール可能です。

*LightDockは、Pythonのパッケージとして提供されているソフトウェアではあるのですが、conda ではなく、PyPI (Python Package Index) で管理されています( PyPI はPythonの、サードパーティーソフトウェアリポジトリである。すべてのオープンソースなPythonパッケージの包括的なカタログととらえることができる。 ウィキペディア)。PyPIで提供されているパッケージに対しては、pip コマンドによりインストール等の管理ができます。

すなわち、LightDockは pip でのインストールが可能ですので、環境 LightDockをアクティブにした状態で、以下のコマンドを実行してください(https://pypi.org/project/lightdock/#description参照)

$ pip install lightdock

これによって、LightDockプログラムおよび、その他必要とされるパッケージ(freesasa, pyparsing, scipy, numpy, cython, prody, biopython)が全てインストールされます。conda list を実行することで確認できます。

環境 LightDock をアクティブにしたままであれば、

$ lightdock3_setup.py

が実行できると思います。その結果、以下のような表示が出ます。

usage: lightdock_setup [-h] [--seed_points STARTING_POINTS_SEED]
                       [-ft ftdock_file] [--noxt] [--noh] [--verbose_parser]
                       [-anm] [--seed_anm ANM_SEED] [-anm_rec ANM_REC]
                       [-anm_lig ANM_LIG] [-rst restraints] [-membrane]
                       receptor_pdb_file ligand_pdb_file swarms glowworms
lightdock_setup: error: the following arguments are required: receptor_pdb_file, ligand_pdb_file, swarms, glowworms

この表示は、「プログラムの使い方が間違っていますよ。」というエラー表示ですが、表示が出ていれば、とりあえずインストールは上手くいっています。

実際のプログラムの使い方、ドッキングシミュレーションの実行は、次回の記事で解説したいと思います。

LightDock チュートリアル : タンパク質のドッキングシミュレーション
  このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介していきたいと考えています。Python は3系(3.7)、anacondaを中心にして環境構築していきます。以下のようなハード...

 

1 LightDock: a new multi-scale approach to protein–protein docking
Brian Jiménez-García, Jorge Roel-Touris, Miguel Romero-Durana, Miquel Vidal, Daniel Jiménez-González and Juan Fernández-Recio
Bioinformatics, Volume 34, Issue 1, 1 January 2018, Pages 49–55, https://doi.org/10.1093/bioinformatics/btx555

2LightDock goes information-driven
Jorge Roel-Touris, Alexandre M.J.J. Bonvin, Brian Jiménez-García
Bioinformatics, btz642; doi: https://doi.org/10.1093/bioinformatics/btz642

コメント

タイトルとURLをコピーしました