ドッキングソフトウェアの能力評価およびパラメータ最適化

KP33
ドッキングソフトウェアの能力評価およびパラメータ最適化
(東北薬科大薬学部)
○小田彰史、岡安愛、神山由紀子、
吉田朋起、松崎久夫
1. はじめに
フトウェアが増えている。それらの中には市販ソフトウ
薬物標的となる生体高分子の立体構造を元にドラッ
ェアと遜色のない機能を持つものもあり、バイオインフ
グ デ ザ イ ン を 行 う Structure-Based Drug Design
ォマティクス等の発展の一助となっている。一方でド
(SBDD) において、標的タンパク質と低分子化合物
ラッグデザインに関連した領域には無料で使用でき
との結合様式を推測することは非常に重要である。
るソフトウェアがあまりない。計算機によるドッキングの
複合体構造を参考に化合物を設計したりヴァーチャ
ためのソフトウェアもほとんどが有償あるいはアカデミ
ルスクリーニングを行ったりする場合、生体高分子-
ックフリーであるが、使用権が無料で得られるドッキン
リガンド複合体構造を予測する必要がある。これまで
グ関連ソフトウェアに ArgusLab1 がある。
生体高分子-リガンド複合体構造を計算機的に予測
ArgusLab は元々分子モデリングのためのソフトウェ
する、すなわち計算機によるドッキングのためのプロ
アとして開発されており、分子構築や分子計算、構造
グラムは多数開発されている。様々な観点から十分
表示などの機能を持っている。分子計算では UFF 力
なテストが行われ、高い信頼性を持って使用されてい
場を実装するなどユニークなソフトウェアであるが、ヴ
るドッキングソフトウェアには GOLD、FlexX、Glide 等
ァージョン 4.0.1 では生体高分子に対して低分子リガ
があるが、これらはいずれも市販されており、商用・学
ンドをドッキングする機能が導入された。ドッキングエ
術用問わず有償で提供されている。これらに次いで
ンジンとしては ArgusDock と GADock の 2 種類を搭
よく使用されるソフトウェアに DOCK、AutoDock 等が
載し、スコア関数に AScore を採用している。
あるが、これらについては非営利の学術研究には無
上述のように ArgusLab は無料でドッキングを行うこ
償で使用できるものの、商用での利用はやはり有料
とのできるソフトウェアであり、またモデリング用途で
である。市販ソフトウェアは高い信頼性と手厚いサポ
開発されたという経緯のために GUI も整備されている。
ート体制を持っており、アカデミックフリーのソフトウェ
さらに Windows 上で使用できるという点も、非専門家
アについても学術研究に対する貢献の大きさは無視
の教育や簡易計算という目的に合致している。このよ
できないが、しかし Computer-Aided Drug Design
うに ArugsLab は無料でありながら操作性や動作環境
(CADD) の非専門家に対する教育や、創薬の初期
の点でも優れているソフトウェアであるが、一方でドッ
段階で簡易的に SBDD の可能性を検討する目的で
キングの能力については十分に検討されていない。
使用するには、その導入コストが無視できない。また
ArgusLab のソフトウェアそのものについて文書が整
大規模計算を行う場合、市販ソフトウェアでは計算規
備されていないこともあり、ドッキング機能については
模に応じた数のライセンスを用意する必要があり、ラ
web 上のチュートリアルや PowerPoint 文書でしか説
イセンス数によって研究の進度が支配されてしまう。
明されていない。それらの文書においても、ごく少数
近年、バイオインフォマティクスや分子シミュレーシ
の例における結果や AScore の結合親和性との対応
ョン、化学計算などの領域では、無料で使用できるソ
などについては述べられているものの、ドッキングの
精度そのものや、ドッキングポーズに対するスコアリン
oda@tohoku-pham.ac.jp
グの妥当性などについては論じられていない。
そこで本研究では、ArgusLab のドッキング機能の
能力について、立体構造既知のタンパク質-リガンド
表 1 計算の設定
(1) ArgusDock
複合体構造に対するテスト計算を通じて評価する。ま
精度
スコア関数の調整
た、ArgusDock、GADock ともにいくつかパラメータが
i
Regular
default
存在するが、それらの値を変動させたときのドッキン
ii
High
default
グ結果の変化についても検討を行う。これらの検討
iii
Regular
疎水性項を削除
によって ArgusLab のドッキング機能の能力を明らか
iv
Regular
水素結合項を 0.5 倍
にし、適切なパラメータ設定を提案する。これにより
v
Regular
全原子の vdW 半径を 0.8 倍
ArgusLab の可能性および限界が明確になり、ソフト
vi
Regular
全原子の vdW 半径を 1.2 倍
ウェアの導入コストなしにドッキング計算を行いたい
vii
Regular
vdW 項を 0.5 倍
場合の指針になるのではないかと考えている。
viii
Regular
vdW 項を 2.0 倍
2. 計算
(2) GADock
今回、ArgusLab のテストに使用した系は、Glide の
スコア関数
個体数
テストセットに含まれる複合体のうちの 55 複合体であ
I
default
default (50)
る。タンパク質-リガンド複合体の立体構造について
II
default
100
は RSCB protein databank (PDB) より入手した実験
III
default
200
構造を利用し、その構造を元にタンパク質、リガンド
それぞれを抽出してドッキングに使用した。ArgusLab
のデフォルトの設定ではタンパク質側の水素は認識
効果、切片値を表している。それぞれの項には回帰
しないため、タンパク質については水素原子を付加
係数が与えられており、AScore は PDBbind2 の結合
していない。一方でリガンドについては水素原子を付
自由エネルギーに対してフィッティングされている。
加し、さらに ArgusLab の UFF 力場を使用して構造最
すなわちスコア関数の 3 つの役割 3-4 のうちヴァーチャ
適化を行った。
ルスクリーニングを意識して作られた関数であり、ドッ
ドッキング計算においては、ArgusDock と GADock
キングポーズの構築や評価において有効かどうかは
の両方について行い、その結果を比較した。また、
定かではない。また、フィッティングの際に使用された
ArgusDock については Regular precision と High
複合体構造は PDB に収載されている実験構造その
precision の両方のモードを試した。スコア関数につ
ものであるため、ドッキングで得られた構造の評価と
いてはデフォルトの値だけではなく、筆者らが独自に
いう目的に適しているかどうかについても検討する必
調整した関数も使用した。AScore の計算式は
要がある。そこで本研究では、AScore に使用されて
いる回帰係数や原子の vdW 半径を調整することによ
ΔGbind = ΔGvdw + ΔGhydrophobic + ΔG H −bond
+ ΔG H −bond (chg ) + ΔGdeformation + ΔG0
って、ドッキング結果およびその評価がどのように変
化するか検討を行った。また GADock については、
GA のパラメータについての調整も行っている。これら
パラメータの調整にドッキングエンジンの選択をあわ
で表される。右辺の六つの項はそれぞれファンデル
せて、全体で 11 通りの計算を行った。行った計算に
ワールス(vdW)力、疎水性効果、水素結合の効果
ついて表 1 にまとめた。なお、ドッキング計算の場合リ
(中性の受容性基・供与性基)、水素結合の効果(荷
ガンド結合部位の選択は非常に重要であるが、本研
電した受容性基・供与性基)、回転可能結合数による
究では PDB の構造中でリガンドの占める位置を結合
な解が得られているので成功率は 27/55 = 0.491)を
部位として指定し、ArgusLab の自動計算機能により
示している。また「total」は、いずれか最低一つの設
ポケットを設定した。また、ドッキングの際は水分子を
定でドッキングに成功した系の数および率を示してい
一切考慮せずに行った。
る。ちなみに、設定 vi で一つの系で解が一つも得ら
ドッキングの結果を評価する際には、PDB 中の実
れなかったことを除いて、他の設定・他の系ではすべ
験構造を「正解」として考え、その構造との重原子の
てなんらかの(妥当か否かを問わず)解が得られてい
RMSD が 2 Å 以下であるような構造を「妥当な解」
る。この図からわかるように、いずれの設定において
として評価した。この妥当な解が得られた場合に
もドッキングの成功率は 50%前後とあまり高くない一
ドッキングが成功したと評価し、妥当な解が得ら
方で、いずれかの設定でドッキングに成功する割合
れなかった場合には失敗したと判断している。ま
は 70%を越えており、高速ドッキングプログラムである
た、計算時間についても比較を行った。
ことを考えるとまずまずの結果と言える。また各設定
これらの計算はすべて、CPU に Pentium D 3.0
での結果を見ていくと、疎水性項や水素結合項を操
GHz を搭載し、メモリ 2 GB を持つ Windows XP
作した設定 iii、iv に比べて、vdW 項を操作した設定
マシンで行っている。また、ドッキングの準備お
v、vi、vii、viii では結果が大きく変動している。これは、
よび実行には ArgusLab 4.0.1 を使用しているが、
AScore のうちで vdW 項がポーズ構築に重要な役割
RMSD の計算等の計算終了後の処理にはアカデ
を果たしている可能性を示唆している。これはポーズ
ミックユーザーに対してフリーで提供されてい
構築の際にはエンタルピー項が重要なのではないか
る分子可視化・解析用ソフトウェア Maestro 7.55
という指摘 6 とも合致している。ただし vdW 半径を変
を使用した。
化させた v、vi ではいずれもデフォルトの設定 i より結
果が改善されているとはいえないため、半径よりも係
3. 結果および考察
数を変化させるほうが効果的であると思われる。また
まず、それぞれの設定におけるスコア関数およびド
GADock の結果を見ると、個体数を増加させるにつ
ッキングアルゴリズムが、ポーズ構築に対してどの程
れて成功率が上昇しており、GA のパラメータ調整の
度有効に機能するかについて評価を行った。その結
重要性が見て取れる。
果を図 1 に示している。この図では、各設定で計算し
次に、表 2 にそれぞれの設定における計算時間を
たときに妥当な解が得られた系の数と、その成功率
示した。55 個の系(設定 vi では 54 個)での平均値、
(たとえば設定 i では全 55 個の系のうち 27 個で妥当
表 2 計算時間(単位:秒)
ArgusDock
GADock
成功率
ii
iii
iv
v
vi
0.7
平均値
296
4049
160
299
295
414
38
36
0.65
中央値
5
145
6
6
6
6
0.6
最大値
10610
54105
3102
10782
12723
9846
vii
viii
I
II
III
平均値
307
345
22
45
91
中央値
6
6
20
35
70
最大値
12194
11088
70
134
260
32
0.55
30
28
成功率
40
34
成功数
i
0.5
26
24
0.45
22
II
III
I
viii
vii
v
vi
iii
iv
i
ii
0.4
total
20
図 1 ポーズ構築に成功した系の数と成功率
中央値、および最も時間のかかった系の計算時間を
特に設定 I では 80%もの高率となっている。また、たと
記 し て い る 。 こ の 表 が 示 す よ う に 、 ArgusDock は
えポーズ数が多くとも設定 II、III のように GADock で
GADock に比べて中央値が小さい一方で平均値が
は 1 位率が高く、ポーズ選択においては AScore は
大きくなっている。これは、ArgusDock がほとんどの系
ArgusDock よりも GADock に適していることがわかる。
では短い計算時間でドッキングができるものの、少数
一方 ArgusDock については 50%前後にとどまってお
の系で非常に計算時間がかかっているためである。
り、たとえば Wang らが PMF について指摘したように
表 2 の最大値を見ると、GADock ではどんな系でも数
疎水性を表面積項から求めるなどといった、何らかの
分で計算が終了しているのに対して、ArgusDock で
改良が必要であることが伺える 7。また、ArgusDock の
は計算が数時間に及ぶ場合があることがわかる。こ
high precision(設定 ii)は、妥当ではない解を落とし
のように、ArgusDock には「苦手な系」が存在しており、
てポーズ数を減らす効果があることを示している。な
計算時間を優先する場合にはそのような系では
お、vdW 半径を減少させた設定 v では非常に 1 位率
GADock を 使 用 す る こ と が 望 ま し い 。 ま た 、 high
が低くなっており、図 1 の結果とあわせて vdW 半径を
precision(設定 ii)は ArgusDock の中でも特に時間が
減少させる設定は ArgusDock においてあまり望ましく
かかっており、使用する際には十分な注意が必要で
ないと考えられる。
あろう。一方 GADock を見てみると、個体数の増加に
ほぼ比例して計算時間が増加している。この点からも、
4. まとめ
GADock は計算時間のコントロールしやすい手法で
本研究では、ArgusLab のドッキング機能についてそ
あることがわかる。
の能力を調査するとともに、どのような設定を用いれ
最後に、図 2 に各設定での AScore がポーズの選択
ば優れた結果が得られるか検討を行った。この機能
にどの程度有用であるかを調べた結果を示す。ここ
の最大の特徴はその高速性にあるが、計算精度につ
では、ドッキングで妥当な解が得られた系のみに絞っ
いても、注意が必要ではあるもののある程度の有用
て、スコア第 1 位に妥当な解が位置していた系の割
性は確保できていることがわかった。今後、今回検討
合(1 位率として記載)を示している。また、各設定で
を行わなかったヴァーチャルスクリーニングにおける
のドッキング計算で得られたポーズ数もあわせて図
AScore の能力の検討や、GADock についてのより詳
示してある。この図からわかるように、おおむね得られ
細な検討を行う予定である。
たポーズ数が少ないほど 1 位率が高いことがわかる。
参考文献
1.
ArgusDock
GADock
ArgusLab 4.0.1, Planaria Software LLC, Seattle,
WA, 2004. (http://www.planaria-software.com/)
1位率
140
0.9
120
0.8
2
R. Wang et al., J. Med. Chem., 48, 4111. (2005).
3
小田彰史、山乙教之、広野修一, SAR News, 11
0.7
(2006) in press.
0.6
80
0.5
60
0.4
1位率
ポーズ数
100
4
0.3
40
A. Oda, K. Tsuchida, T. Takakura, N. Yamaotsu,
S. Hirono, J. Chem. Inf. Model., 46, 380 (2006).
0.2
20
0.1
0
5
0
i
ii
iii
iv
v
vi
vii viii
I
II
2006.
III
6
図 2 計算で得られたポーズ数と、スコア第 1 位に妥
当な解が位置していた割合
Maestro 7.5, Schrödinger, LLC, New York, NY,
D. B. Kitchen et al., Nat. Rev. Drug. Discovery, 3,
935 (2004).
7
R. Wang et al., J. Med. Chem., 46, 2287 (2003).