NatureProtocols大规模对接
编译
刘名权
审稿
陶雯
本文介绍由美国加州大学旧金山分校、瑞典乌普萨拉大学以及LeidosBiomedicalResearch公司的研究人员——BrianK.shoichet课题组发表在NatureProtocols的研究成果:在早期的药物发现中,对大规模化合物库进行基于结构的对接筛选就已经非常常见,作者概述了在此过程中的一些最佳实践和控制对接计算来帮助评估对接参数。作者具体地介绍了基于结构的药物发现通用指南和使用DOCK3.7对接软件、ZINC20筛选数据库进行对接任务的细节。最后,作者给出预期结果并列举出一些可能导致实验失败(所买的化合物并未显示出对靶标的活性)的原因。
1介绍
使用生物物理实验筛选化学库已经成为了发现新化学型的主流方法。尽管通过高通量筛选(High-throughput-screening,HTS)筛选后的库与使用传统的前分子药理学的库相比,它们已经做了很大的扩展,但它们仍然只代表极少数可能的“类药物”分子。
在探索更大的化学空间的过程中,使用虚拟库进行计算是一种有吸引力的方式,因为虚拟库中至少包含了数百亿,甚至可能更多的分子。当然,由于时间、成本和存储的限制,这些化合物中很少有能够真正合成的,但人们可以使用一些计算方法来优先考虑那些“应该追求”的化合物。
超大库的对接带来了机遇的同时也带来了挑战。为了对接测试库中的每个分子在蛋白质结合位点中的适合度,通常需要对数十万到数百万种可能的配置进行采样,然后使用几种不同的评分函数中的一种来对分子的适合度进行评分。为了在中等规模的计算机集群(例如-核)实现10亿分子库,这种计算的消耗必须不超过1s/分子/核(1ms/配置)。这意味着计算无法提供达到化学精度所必需的详细程度和相互作用项的数量。因此,对接通常采用欠采样的构象状态、忽略重要的项和使用近似项等处理手段。
这些近似以及被忽略的项使得对接产生已知的误差,甚至导致该方法不能对来自更大的库筛选的分子进行可靠的排序,只能寄希望于从大量不太可能和靶标结合的分子中分离出小部分合理的配体。本文的目标是为研究者提供此类最佳实践和超大型库对接的控制计算,尽管它们同样适用于中等规模的库对接。虽然这并不能确保未来对接活动的成功,但研究者可以避免一些更常见的失败原因。
2
基于虚拟结构的药物发现通用指南
作者描述了可用于各种对接程序的方案和控制(图1)。
结构准备
任何基于结构的对接活动都是从合适的靶标位点开始。对于虚拟筛选活动来说最好的切入点通常是一个高分辨率的配体结合结构。配体结合(holo)结构通常要优于无配体(apo)结构,原因是结合口袋的几何形状在结合状态下更好定义。
完全按照数据库中的结构来使用并不总是一个好主意,通常需要考虑突变、水分子、氢原子、辅因子等因素,对高分辨率的蛋白质结构进行修改。
同源模型
当靶蛋白的实验结构尚未确定时,可以根据已知具有高序列同一性的模板结构生成结构模型。有两个原则可以提高成功几率:
(1)通常,靶标和模板之间的序列同一性越高,模型准确性就越好。应特别
转载请注明:http://www.abuoumao.com/hyls/7413.html