药物设计常用方法分子对接方法

来源：互联网发布：淘宝哪里进货渠道好呢编辑：程序博客网时间：2024/04/29 12:21

一：概述
  分子对接是指两个或多个分子通过几何匹配和能量匹配相互识别的过程，在药物设计中有十分重要的意义。药物分子在产生药效的过程中，需要与靶酶相互结合，这就要求两个分子要充分接近并采取合适的取向以使二者在必要的部位相互契合，发生相互作用，继而通过适当的构象调整，得到一个稳定的复合物构象。通过分子对接确定复合物中两个分子正确的相对位置和取向，研究两个分子的构象特别是底物构象在形成复合物过程的变化是确定药物作用机制，设计新药的基础。
  分子对接计算把配体分子放在受体活性位点的位置，然后按照几何互补、能量互补以及化学环境互补的原则来评价药物和受体相互作用的好坏，并找出两个分子之间最佳的结合模式。由于分子对接考虑了受体结构的信息以及受体和药物分子之间的相互作用信息，因此从原理上讲，它比仅仅从配体结构出发的药物设计方法更加合理。同时，分子对接筛选的化合物库往往采用的是商用数据库，比如可用化合物数据库（ACD）、剑桥晶体结构数据库（CSD）、世界药物索引（WDL）、药用化合物数据库（CMC）以及可用化合物搜索数据库（ACDSC）等等，因此筛选出来的化合物都为已知化合物，而且相当大一部份可以通过购买得到，这为科研提供了很大的方便，近年来，随着计算机技术的发展、靶酶晶体结构的快速增长以及商用小分子数据库的不断更新，分子对接在药物设计中取得了巨大成功，已经成为基于结构药物分子设计中最为重要的方法。
  分子对接的最初思想源自于“锁和钥匙”的模型，即“一把钥匙开一把锁”。不过分子对接，也就是药物分子和靶酶分子间的识别要比“钥匙和锁”的模型要复杂的多，首先表现在药物分子和靶酶分子是柔性的，这样就要求在对接过程中要相互适应以达到最佳匹配；再者，分子对接不仅要满足空间形状的匹配，还要满足能量的匹配，底物分子与靶酶分子能否结合以及结合的强度最终是由形成此复合物过程的结合自由能的变化值决定。互补性和预组织是决定分子对接过程的两个重要原则，前者决定识别过程的选择性，而后者决定识别过程的键和能力。互补性包括空间结构的互补性和电学性质的互补性。受体和底物分子在识别之前将受体中容纳底物的环境组织的愈好，其溶剂化能力就越低，则它们的识别效果愈佳，形成的复合物越稳定，这就是分子识别的预组织原则。

二：分子对接的种类
1.刚体对接：指在对接过程中，研究体系的构象不发生变化。适合考察比较大的体系，如蛋白质和蛋白质间以及蛋白质和核酸之间的对接。
2.半柔性对接：指在对接过程中，研究体系尤其是配体的构象允许在一定的范围内变化。适合处理大分子和小分子间的对接，对接过程中，小分子的构象一般是可以变化的，但大分子是刚性的。
3.柔性对接：指在对接过程中，研究体系的构象基本上可以自由变化的。一般用于精确考虑分子间的识别情况。由于计算过程中体系的构象可以变化，所以计算耗费最大。
三：分子对接中的重要问题
  分子对接的目的是找到底物分子和受体分子间的最佳结合位置，所以要面对的重要问题是如何找到最佳的结合位置和如何确定对接分子间的结合强度？
  如何找到最佳的结合位置牵涉到优化的问题。底物分子和受体分子都是可以自由转动和平动的，同时两个分子自身的构象也存在变化，因此它们之间可能的结合方式是非常复杂的，所以简单的系统搜索方法是不够的，要引入其他高效的优化方法，常用的有遗传算法、模拟退火以及禁忌搜索等。
  如何确定对接分子间的结合强度涉及到底物分子和受体分子间结合能力的预测，牵涉到结合自由能的计算。结合自由能包括以下几个方面的贡献:1 受体分子和底物分子气态下分子对接过程的自由能变化，约为对接过程中的函变;2 受体分子、底物分子以及复合物分子的溶剂化自由能；3 对接过程中的熵变。在这几项中，气态下分子对接过程的函变可以通过分子力学的方法简单求算，但去溶剂化能准确而快速的求算还存在一定的问题，不过熵变的计算可能是最大的问题，因为它的计算需要耗费大量时间，而在实际的药物设计过程中，研究人员总是希望能快速筛选成千上万的分子。所以目前采用的是较为简单的自由能评价方法。

四：几种有代表性的分子对接方法
4.1 DOCK
  DOCK是Kuntz研究小组发展的分子对接程序，可能是目前应用最为广泛的分子对接程序之一.它能自动地模拟配体分子在受体活性位点的作用情况，并把理论预测最佳的方式记录下来。而且该方法能够对配体的三维结构数据库进行自动搜索，因此被广泛应用于基于受体结构的数据库搜索的药物设计中，并取得了巨大的成功。用DOCK进行药物设计以及数据库的搜索基本上可以分为下面几个步骤:配体和受体相互作用位点的确定，评分系统的生成，DOCK计算及DOCK结果的处理与分析。活性位点的确定和表达是DOCK最重要的特点之一。活性位点特征的确定对于DOCK研究是非常重要的，因为配体分子和受体相互作用过程的模拟主要就是参考几何位点的几何特征进行的。在DOCK中，活性位点的确定通过sphgen程序来完成。DOCK软件包中sphgen程序生成受体表面所有的凹陷的负像，并对这些负像进行聚类分析。在DOCK程序中，表面点采用了Richards提出的模型。在这些表面点的基础上，采用sphgen程序生成了负像，它实际上由一些与分子表面点相切的圆球叠加而成。
  在生成负像的基础上，就可以进行配体分子和活性口袋之间的匹配。在这里，配体也
采用一组球集来表示，和负像不同的是，配体所用的球集表示配体所占的空间区域。如果
配体分子能和活性口袋形成比较好的匹配，那么配体的球集一定能和活性口袋中的负像形
成好的叠合。配体分子和负像之间的匹配原则是基于配体和受体之间球集的内坐标的比较。
按照匹配原则得到了配体和受体之间的匹配情况之后.就要通过合理的得分函数来选择最优的结果。DOCK提供了多种得分函数来评价配体和受体之间的结合情况，包括原子接触得分以及能量得分。
  DOCK进行分子对接时，配体分子可以是柔性的。对于柔性的分子，其键长和键角保持
不变，但可旋转二面角是可以发生变化的。在DOCK中，柔性分子的构象变化通过下面的
操作实现:首先是刚性片断的确定，然后是构象搜索。构象搜索采用两种方法:一种是锚优
先搜索(anchor-first search),第二种方法是同时搜索(simultaneous search).

4.2 AUTODOCK
  AUTODOCK是Scripps的Olson科研小组开发的分子对接软件包，最新的版本为3.05，AUTODOCK采用模拟退火和遗传算法来寻找受体和配体最佳的结合位置，用半经验的自由能计算方法来评价受体和配体之间的匹配情况。在AUTODOCK中，配体和受体之间结合能力采用能量匹配来评价。在1.0和2.0版本中，能量匹配得分采用简单的基于AMBER力场的非键相互作用能。非键相互作用来自于三部分的贡献:范得华相互作用，氢键相互作用，以及静电相互作用。在3.0版中，AUTODOCK提供了半经验的自由能计算方法来评价配体和受体之间的能量匹配
  在最早的AUTODOCK版本中，作者采用了模拟退火来优化配体和受体之间的结合。在
3.0版本中，Morris等发展了一种改良的遗传算法，即拉马克遗传算法(LGA)。测试结果表
明，LGA比传统的遗传算法比模拟退火具有更高的效率。在LGA方法中，作者把遗传算法和局部搜索(local search)结合在一起，遗传算法用于全局搜索，而局部搜索用于能量优化。在AUTODOCK中，局部搜索方法是自适应的，它可以根据当前的能量调节步长大小。LGA算法引入了拉马克的遗传理论，LGA最大的特点就是通过进化映射(developmental mapping)把基因型转化为表现型而实现局部搜索和遗传算法的结合。基因型空间通过遗传算子突变和交叉来定义;而表现型则通过问题的解来定义，这里表示体系的能量得分。

4.3 FIexX
  FIexX 是德国国家信息技术研究中心生物信息学算法和科学计算研究室的Matthias
Rarey等发展的分子对接方法，现在己经作为SYBYL分子模拟软件包中的一个模块实现了商业化。FIexX中结合了多种药物设计的方法进行配体和受体之间的对接。在FIexX中，配体和受体之间结合情况的评价采用了类似Bbhm提出的基于半经验方程的自由能评价方法。在FlexX中，分子对接的流程主要分为下面的步骤:
(1)核心结构确定
  对接的第一步为核心片断(base fragment)的选择。核心片断是指能对配体和受体之间
相互作用起决定作用的基团，而且核心片断的构象要尽量少一些。核心基团的正确选择对分子对接的计算结果有非常重要的影响。因为如果核心基团和受体之间不存在明显优势的相互
作用时，则很难正确预测正确的结合模式。随着核心基团的增加，则核心基团和受体之间的
相互作用也会相应增强，那么结合模式准确预测的机会就会大大增加。因此在选择核心基团时，核心基团包含的基团要尽量多一些。而且核心基团的构象数要尽量少一些。当核心基团选定以后，就可以把配体分子划分为多个片断。
(2)核心结构的放置
  当选择好了核心基团以后，就要把核心基团放置在活性位点的正确部位。在放置核心基
团的时候，FlexX采用了一种形态聚类算法(pose clustering algorithm)算法)，在这个算法中，一个核心基团可以看作为一个具有明确相互作用点的刚性物体，而受体分子的活性口袋也可以看作为一个具有明确相互作用点的刚性物体。把核心基团放置在活性口袋中的过程就相当于把配体中的二个相互作用点叠合在活性位点的三个相互作用点上(假设这三个点不共线)。在匹配中，两个三角形三个顶点所具有的相互作用特征应该是符合的，同时三角形对应边长的差别应该在一定的范围内。放置核心结构的第一步就是找出所有相匹配的这些三角形，而且对配体的位置进行坐标转化。当所有的转化完成以后，检查配体是否和受体产生了碰撞，去掉一些不合理的核心结构取向。对于得到这些核心结构的可能位置，通过核心结构空间的位置均方根位移(r.m.s.D )进行聚类分析。对应那些r.m.s.D值小于一定阀值的空间位置进行归并，仅仅保留那些相差较大的空间位置。最后，检查这些核心结构和受体之间的相互作用情况，对结构进行简单的修饰.
(3)配体分子的生长
  当核心结构在活性口袋中的位置确定以后，配体分子的其它部分可以分为小的片断，依
次“生长”在核心结构上。片断生长采用树形搜索(tree search)的方法，算法和SYBYL中的系统搜索所采用的算法基本类似，在搜索的过程中要尽量删除那些无用的分支。搜索树的第一层是核心结构在活性口袋中的不同放置位置。在下一层中，片断要采用尽可能多的形式连接到核心结构上。然后，按照树形结构，片断依次连接。如果片断能和受体形成氢键或盐桥，则优先连接，因为相互作用形式越明确，片断的几何定位越容易。在对接过程中，一个完全无遗漏的树形结构在造作上是很困难的，因此对于树的每个节点，我们仅仅只考虑最佳的k种结果，这样会为下面的生长节约所要耗费的计算开支。k种最佳的结构采用上面介绍的得分函数来选择。
  增加新的基团以后，如果发现新的相互作用，或配体和受体之间存在重叠，则需要对配
体的位置进行优化。FIexX采用点的加权叠合法(weighted superposition of points)来进行优化。
  当配体生长结束以后，我们可以得到k个最佳的配体和受体的结合形式，从中用户可以
选择需要的结果。FIexX的分子对接过程中，配体的生长以及柔性的考察和DOCK中采用的锚优先方法基本类似。FIexX己经实现了商业化，而且程序可以自动地对数据库中的多个分子进行分子对接的计算，然后给出最佳的结果。同时FIexX提供了友好的图形界面，易于操作，因此可能在药物设计中具有较好的应用前景。

4.4 Affinity
  Afinity是Accelrys (MSI)和杜邦联合开发的分子对接方法，也是最早实现商业化的分子对接方法。Afinity中提供了多种分子对接的策略，可以根据用户的需要提供多种方法的组合。在Afinity中，分子对接可以大致分为两个步骤:首先通过蒙特卡罗或模拟退火计算来确定配体分子在受体活性口袋中可能的结合位置:然后，在第一步的基础上，采用分子力学或分子动力学方法进行进一步细致的分子对接。和其它分子对接方法比较，Affinity具有自己的特色。首先，Affinity中提供了多种对接方法的结合，比如蒙特卡罗方法和分子力学、分子动力学以及模拟退火方法的结合;这些方法结合的灵活性为多种分子对接问题提供了解决方案。第二，在Affinity中，不仅仅配体是柔性的，受体的重要部位，比如活性位点中的某些残基也可以定义为柔性的区域。第三，Affinity提供了精确和快速计算配合和受体之间非键相互作用的两种有效方法，一种是基于格点的能量计算方法，而另一种则是单元多偶极(cell multipole method)方法。第四，Afinity采用了Stouten提出的溶剂化模型来考察配体和受体在堆积过程中溶剂化能的变化。
  在Affinity中，配体和受体之间匹配主要采用能量得分的评价方式。对于能量得分，Afinity采用两种力场，即CVFF力场和CFF力场。Afinity中提供了基于格点的能量计算方法
以及不基于格点的能量计算方法。对于这两种不同的方法，其能量评分函数略有区别。在基于格点的能最计算中，可以考虑溶剂效应的影响。
  Afinity提供了一套多种方法相结合的分子对接流程，整个流程都是自动化的，不需要用户给予任何的千预。在这个流程中，采用蒙特卡罗的方法对每个优化后的结构进行取样，得到配体在尽量多样性的空间取向。在Afinity中，对接流程不是固定的，用户可以按照自己的需要设计相应的流程。比如，用户可以把蒙特卡罗取样和分子动力学模拟结合起来，用蒙特卡罗模拟先得到若干个配体在活性口袋可能的对接位置，然后对这些对接结构用分子动力学进行更加细致的采样，最后对从不同起点得到的分子动力学轨迹进行分析来得到正确的结果。
Afinity方法采用了多种方法的结合为用户解决不同的问题提供了不同的解决方案。Afinity适合对配体和受体之间的相互作用模式进行精细地考察，但它不太适合对大量的配体分子进行基于分子对接的虚拟筛选，因为Affinity对配体和受体都采用了柔性的策略，需要消耗较大的计算量。

五：软对接的实现过程

把受体分子和配体分子放在空间中的任意位置，想通过软对接找到可能的结合构象，需要采用下面的操作步骤:
1. 把两个分子中的大分子作为目标分子,小分子作为探针分子，分别产生目标分子和探针分子的溶剂可极性表面。分子溶剂可及性表面表征方法把分子的表面描绘成一个很平滑的空间，它较好地表征了分子在溶液中和溶液的接触情况。在分子对接中，采用溶剂可及性表面是很合适的，平滑的分子表面使对接过程操作起来比较容易.可及性表面点矢量的匹配性可以很好地描述底物分子和靶酶分子的局部匹配情况。
2. 计算目标分子和探针分子的坐标重心，把目标分子坐标重心作为坐标系的零点。把探针分的坐标重心平移到坐标系的零点位置作为对接的起点计算两个分子的几何尺寸，确定搜索空间。搜索空间用一个矩形来定义，它包含整个受体分子或配体分子。在对接的过程巾.探针分子的坐标重心到目标分子的坐标重心之间的距离不能超过二者半径之和。
3. 上面的对接范围定义适用于进行全局搜索的情况。在对接过程中，也可以把探针分子
的运动定义在特定的空间范围内，使得探针分子只能在特定空间区域(比如活性位点)和目标分子对接。这样做的目的是为了约束探针分子的运动范围，而只在特定的范围进行局部搜索
4. 探针分子转动和平动六个自由度去对接目标分子，并对每种结合情况进行评估。评估采用上面介绍的表面匹配得分。
5. 采用优化方法来优化分子对接的过程，得到最佳的分子对接模式。在SFDOCK程序中，可以采用不同的优化方法，包括单纯型法、蒙特卡罗模拟退火方法以及遗传算法。
6. 对于优化得到的结果，保留表面匹配最佳的且在空间上具有较大差别的构象。在这里，
我们采用坐标均方根位移(r.m.s.)来评价两个探针分子在空间取向上的差别。对于得到的
基于表面匹配的最佳分子对接模式，可以采用能量匹配进行进一步的分析。

  所谓柔性对接是主要是指在分子对接过程中，底物和受体的构象是可以允许发生变化的。在SFDOCK方法中，目前我们仅仅允许配体小分子的可旋转二面角发生变化。因此，柔性对接和软对接比较，需要优化的变量个数是不同的。软对接只有六个变量: 三个平动自由度，三个转动自由度。而柔性对接除了这六个自由度以外，还包括了底物分子的部分二面角变量.至于柔性对接的优化和软对接的优化方法则基本相同。具体的计算步骤也基本相似。

六：分子对接过程中的优化方法
  分子对接过程实际上是一个复杂的优化过程，它的复杂之处可以从两个方面来考虑。首先，对接时受体分子和底物分子的构象会发生一定程度上的变化，同时考虑底物和受体的构象变化是很困难的，软对接只是部分解决了这个问题，对于复合物前后构象变化较大的情况仅仅采用软对接是无法得到好的结果的，在这种情况下只能采用柔性对接。但考虑到计算效率的问题，因此在一般情况下，我们实际上仅仅只考虑小分子的柔性变化，而不考虑靶酶构象的变化(靶酶构象的变化相对底物分子而言变化不大)。其次，在分子对接时，构象空间中存在大量的局部极小，并且对接目标函数在某些区域常常是不连续的，即使在结合位点附近，采用常见的梯度优化方法，比如最陡下降法、共扼梯度法以及牛顿叠代法一般是很难得到最佳解的。解决此类问题的最佳方法是采用一些启发式的随机方法如Monte Carlo方法、模拟退火方法以及遗传算法等。
下面我们简单介绍一下在SMOCK采用遗传算法时的优化过程，它分为下面的步骤:
产生初始种群:首先随机地产生初始种群中的若干个个体，每个个体代表一种对接情况。在软对接中，个体由六个数的一维数组组成，这六个数代表探针分子的平动和转动值。在柔性对接中，个体中除了六个探针分子的平动和转动值以外，还包括用户定义的探针分子的可旋转单键的二面角数值。产生了初始种群后，就可用得分函数来来评价每个个体。在遗传算法的优化过程中，目标分子和探针分子之间的表面匹配得分或能量匹配得分为遗传优化的得分函数。
选择操作:种群中的所有个体被评价后，就可以根据种群中个体的得分结合随机方法来选择被新种群保留的个体。
交叉操作:选择操作结束后，就可以对种群中的个体进行交叉操作，用新个体替代被淘汰的个体。交叉操作是这样进行的:如果一个随机数小于交叉几率，则在种群中随机地选择两个个体作为母体，然后将这两个母体随机地分为两段，并将相应的部分进行交叉换位，得到两条新链。在交叉操作的过程中，可以根据需要进行单点交叉或多点交叉。
突变操作:突变操作是这样进行的。先产生一个随机数，如果此数小于突变几率，则在种群中随机地选择一个个体进行突变操作，突变操作时在这个个体中随机产生一个突变位点，并将此位点的数值用一个随机数代替。通过交叉和突变而产生的新的种群中的所有个体均要用得分函数来予以评价。
比较操作:在遗传算法操作过程中，为了将最好的个体标记下来，我们用了一个“精华”种群来保存它们，在进行每次遗传操作后，逐一比较新种群中的个体和“精华”种群中的个体，如果新种群中存在更好的个体，就把它们拷贝到“精华”种群中去。在比较的过程中，我们要求“精华”种群的个体空间取向上差别尽可能大。具体比较操作如下:如果种群中的某个个体比“精华”种群的所有个体都具有更好的得分，而且它和“精华”种群中的个体之间的坐标r.m.s.满足预先定义的条件，则用这个个体来替代“精华”种群中的最差个体。如果某个个体比“精华”种群中的所有个体都具有更好的得分，但它和某个个体之间的坐标r.m.s.较小，则用这个较好的个体来替代精华种群中的这个较差的个体。
考虑到遗传算法在局部极值附近会振荡较长时间，为了帮助遗传算法脱离局部极值，每次交又和突变操作后。把种群中的若干个得分最差的个体用随机产生的个体替代。在经过足够长的优化过程后，当精华种群的个体不再发生变化时，计算收敛。