このカテゴリーの記事では、「Pythonを使った機械学習やケモ・バイオインフォマティクスの実装や論文」を紹介していきたいと考えています。Python は3系(3.7)、anacondaを中心にして環境構築していきます。以下のようなハード・ソフト環境(CentOS Linux)を用いますが、Python(anaconda)が利用できれば、異なる環境下でも類似の実装が可能かと思います。
- CPU Intel® Core™ i7-6700K CPU @ 4.00GHz × 8
- メモリ 64GB
- GPU GeForce GTX 1080/PCIe/SSE2
- OS CentOS Linux 8
- Python 3.7
LightDock のインストール
ドッキングシミュレーションをパソコン上で実行するために、AutoDock, Gold, Glideなど、無償・有償の多くのソフトウェアが開発されています。この記事では、比較的新しく、またPythonパッケージとしての導入が可能な、 “LightDock” を紹介します。LightDock を使うことで、Glowworm Swarm Optimization (GSO)アルゴリズムに基づいたタンパク質-タンパク質間、タンパク質-ペプチド間、タンパク質-DNA間のドッキングシミュレーションを実行することができます。 前回、前々回の記事のように、環境構築を進めますが、今回は、condaと並ぶ(condaより老舗の)Pythonパッケージ管理プログラムである pip も使用します。
“LightDock” の詳細については、文末の論文1, 2を参照してください。論文の中身についても、今後紹介したいと考えています。
まずは、以下のコマンドで、仮想環境 LightDockを作成します。
$ conda create -n LightDock python=3.7
y
を入力して、完了してください。
その後、conda activate LightDock
を実行して、環境 LightDockをアクティブにしてください。その状態で、conda list
を実行すると、
(LightDock) [xxxx@localhost ~]$ conda list
# packages in environment at /home/xxxx/anaconda3/envs/LightDock:
#
# Name Version Build Channel
_libgcc_mutex 0.1 main
ca-certificates 2021.1.19 h06a4308_0
certifi 2020.12.5 py37h06a4308_0
ld_impl_linux-64 2.33.1 h53a641e_7
libedit 3.1.20191231 h14c3975_1
libffi 3.3 he6710b0_2
libgcc-ng 9.1.0 hdf63c60_0
libstdcxx-ng 9.1.0 hdf63c60_0
ncurses 6.2 he6710b0_1
openssl 1.1.1j h27cfd23_0
pip 21.0.1 py37h06a4308_0
python 3.7.9 h7579374_0
readline 8.1 h27cfd23_0
setuptools 52.0.0 py37h06a4308_0
sqlite 3.33.0 h62c20be_0
tk 8.6.10 hbc83047_0
wheel 0.36.2 pyhd3eb1b0_0
xz 5.2.5 h7b6447c_0
zlib 1.2.11 h7b6447c_3
と表示されたと思います。このなかに、パッケージ pip があることがわかると思います。pip が見当たらない場合には、conda install pip
でインストール可能です。
*LightDockは、Pythonのパッケージとして提供されているソフトウェアではあるのですが、conda ではなく、PyPI (Python Package Index) で管理されています( PyPI はPythonの、サードパーティーソフトウェアリポジトリである。すべてのオープンソースなPythonパッケージの包括的なカタログととらえることができる。 ウィキペディア)。PyPIで提供されているパッケージに対しては、pip コマンドによりインストール等の管理ができます。
すなわち、LightDockは pip でのインストールが可能ですので、環境 LightDockをアクティブにした状態で、以下のコマンドを実行してください(https://pypi.org/project/lightdock/#description参照)。
$ pip install lightdock
これによって、LightDockプログラムおよび、その他必要とされるパッケージ(freesasa, pyparsing, scipy, numpy, cython, prody, biopython)が全てインストールされます。conda list
を実行することで確認できます。
環境 LightDock をアクティブにしたままであれば、
$ lightdock3_setup.py
が実行できると思います。その結果、以下のような表示が出ます。
usage: lightdock_setup [-h] [--seed_points STARTING_POINTS_SEED]
[-ft ftdock_file] [--noxt] [--noh] [--verbose_parser]
[-anm] [--seed_anm ANM_SEED] [-anm_rec ANM_REC]
[-anm_lig ANM_LIG] [-rst restraints] [-membrane]
receptor_pdb_file ligand_pdb_file swarms glowworms
lightdock_setup: error: the following arguments are required: receptor_pdb_file, ligand_pdb_file, swarms, glowworms
この表示は、「プログラムの使い方が間違っていますよ。」というエラー表示ですが、表示が出ていれば、とりあえずインストールは上手くいっています。
実際のプログラムの使い方、ドッキングシミュレーションの実行は、次回の記事で解説したいと思います。
1 LightDock: a new multi-scale approach to protein–protein docking
Brian Jiménez-García, Jorge Roel-Touris, Miguel Romero-Durana, Miquel Vidal, Daniel Jiménez-González and Juan Fernández-Recio
Bioinformatics, Volume 34, Issue 1, 1 January 2018, Pages 49–55, https://doi.org/10.1093/bioinformatics/btx555
2LightDock goes information-driven
Jorge Roel-Touris, Alexandre M.J.J. Bonvin, Brian Jiménez-García
Bioinformatics, btz642; doi: https://doi.org/10.1093/bioinformatics/btz642
コメント