AlphaFold2已经从CASP14大会上横空出世了好久,也对外共享了预测结构数据库AlphaFold Protein Structure Database。对于做CADD的人而言,以前很多没有结构的蛋白靶点也终于有了结构数据可供分析计算。因此,AlphaFold2预测的海量结构能否直接用于开展虚拟筛选?
以下结论与结果来自发表在Protein Sci期刊上的题为“Evaluation of AlphaFold2 structures as docking targets”的论文。
虽然AlphaFold2能够预测出较为精确的蛋白骨架(Backbone)结构,但将其直接作为蛋白受体结构进行分子对接结果并不十分理想。
但是,通过去除AlphaFold2预测结构中的低置信区域或使用柔性对接方法针对关键侧链添加柔性等,有助于改善对接结果。
AlphaFold2预测结构相较于 apo 结构做对接更准确。
使用AutoDock-GPU作为分子对接工具,在PDBbind V2003数据集中对实验共结晶受体结构和AlphaFold2结构进行配体再对接。
以最高排名的对接构象的RMSD<2 ?为衡量标准,使用AutoDock‐GPU对晶体结构进行重新对接,成功率为41%,这与之前发表的AutoDock 4的45%性能相当。相比之下,对接AlphaFold2预测结构的成功率为17%。
对接成功率没有受到复合物低聚物性质的大幅影响。但对含有辅因子的结构,两种方法的结构都表现出较低的对接成功率。
<2 ? RMSD | <2 ? RMSD | 2–5 ? RMSD | 2–5 ? RMSD | >5 ? RMSD | >5 ? RMSD | ||
---|---|---|---|---|---|---|---|
Structures | Number | PDB (%) | AF2 (%) | PDB (%) | AF2 (%) | PDB (%) | AF2 (%) |
All | 2474 | 41 | 17 | 25 | 24 | 34 | 60 |
Monomer | 1797 | 40 | 17 | 24 | 24 | 36 | 59 |
Oligomer | 677 | 44 | 17 | 28 | 22 | 28 | 60 |
No cofactor | 1821 | 47 | 18 | 24 | 22 | 30 | 60 |
Cofactor | 653 | 25 | 15 | 31 | 28 | 44 | 57 |
AlphaFold2预测的结构文件中包含每个残基在0到100范围内的置信度估计,分数越高,置信度越高。当预测AlphaFold2预测的低置信区域位于结合位点附近时,它们可能会影响对接的准确性。删除干扰的低置信的残基并使其具有柔性,从而大大改善了结果。因此,针对AlphaFold2预测结构做对接,我们需要十分注意结构的质量。
使用AutoDock将AlphaFold2预测结构中的Cα旋转来模拟特定的柔性侧链,对接结果明显提高(分别为0.48和1.86?)。
使用柔性对接方法针对关键侧链添加柔性有助于改善对接结果。
AlphaFold2预测结构相较于Apo结构的对接成功率更高 (16% vs. 10%)。但AlphaFold2与Apo的成功率都较低,这可能是因为二者均结构缺乏诱导构象的配体。
[1]. Holcomb M, Chang YT, Goodsell DS, Forli S. Evaluation of AlphaFold2 structures as docking targets. Protein Sci. 2023 Jan;32(1):e4530. doi: 10.1002/pro.4530. PMID: 36479776; PMCID: PMC9794023.