在药物研发的靶点识别中,计算机模拟通过构建和分析蛋白质的三维结构,揭示其与疾病的关联及潜在配体结合位点。以下是常用的结构模拟方法及其应用场景和工具:
利用已知同源蛋白的实验结构(模板),通过序列比对预测目标蛋白的三维结构。适用于与已知结构蛋白序列同源性≥30% 的靶点。
-
模板搜索:通过序列比对工具(如 BLAST、HHblits)从 PDB 数据库中检索同源蛋白(序列 identity >30% 时建模结果可靠性较高)。
-
序列比对:确定保守区域(如功能结构域)和可变区域(如环区)。
-
模型构建:
-
使用Modeller软件基于模板构建主链结构,填充环区和侧链。
-
对可变区域(如 loop 区)通过分子动力学优化构象。
-
模型评估:通过ProSA-web计算 Z-score(评估整体折叠合理性)、ProQ预测 QMEAN 值(评估局部结构可靠性)。
-
解析疾病相关蛋白(如 GPCR、激酶)的结构,若其同源蛋白已有实验结构(如 β2 肾上腺素受体的同源蛋白)。
-
案例:HIV 蛋白酶的同源建模曾助力早期抗艾药物设计。
无同源模板时,通过物理化学规律(如能量最小化、分子动力学)预测蛋白结构,适用于短肽或结构简单的蛋白(如≤200 氨基酸)。
-
片段组装:从已知结构数据库中提取短片段(如 3-9 个氨基酸的构象片段),通过蒙特卡洛模拟组合成完整结构。
-
工具:Rosetta(适用于小蛋白和蛋白 - 蛋白复合物)、QUARK(针对无模板蛋白)。
-
能量优化:通过分子力学(如 AMBER 力场)最小化构象能量,避免原子碰撞。
-
解析全新靶点(如新型病毒蛋白)或低同源性蛋白(序列同源性 < 20%)。
-
案例:2020 年新冠病毒主蛋白酶(Mpro)的从头建模为抑制剂设计提供了结构基础。
基于深度学习的端到端结构预测模型,通过进化信息(多序列比对)和注意力机制预测残基间距离和二面角,直接生成高精度结构。
-
无需模板:对同源性极低的蛋白(如单链抗体、非结构化蛋白)仍可预测。
-
高精度:对大部分蛋白的预测精度接近实验结构(如 TM-score>0.9,相当于 X 射线晶体衍射精度)。
-
AlphaFold2 Colab:开源版本,可在线提交序列并获取预测结构。
-
AlphaFold DB:已预计算人类蛋白组及常见病原体蛋白结构,可直接检索下载。
-
快速解析疑难靶点结构(如 GPCRs、离子通道),大幅缩短结构获取时间。
-
案例:AlphaFold2 预测的人类蛋白组结构已被广泛用于药物虚拟筛选。
将小分子配体 “对接” 至靶点蛋白的活性口袋,通过几何匹配和能量打分筛选潜在结合模式,用于靶点 - 配体相互作用预测。
-
靶点准备:去除蛋白配体和水分子,修复缺失残基(如用 PyMOL 补全 loop 区),计算电荷(如用 APBS 工具生成静电势)。
-
配体准备:生成小分子三维构象,计算氢键供体 / 受体、电荷等参数。
-
对接计算:
-
刚性对接:固定蛋白构象,快速筛选大量配体(如 AutoDock Vina,适用于虚拟筛选)。
-
柔性对接:允许蛋白侧链或配体构象变化(如 Glide 的 SP/FXP 模式,适用于精细优化)。
-
结果分析:通过打分函数(如 GoldScore、X-Score)排序结合模式,重点关注结合能(ΔG< -5 kcal/mol)和关键相互作用(如与活性位点氨基酸形成氢键)。
-
从化合物库中筛选潜在靶点抑制剂(如 ZINC 库对接 SARS-CoV-2 主蛋白酶)。
-
验证靶点 - 配体结合的合理性(如预测某突变是否破坏结合)。
通过牛顿力学模拟蛋白在溶液中的动态行为,预测构象变化、结合稳定性和功能机制。
-
构象采样:
-
对初始结构(如同源建模或 AlphaFold2 预测结构)进行 MD 模拟(50-100 ns),获取动态构象集合(如酶的开放 / 闭合态)。
-
工具:GROMACS、Amber、Desmond。
-
结构优化:
-
对建模结构中的不合理区域(如冲突的侧链)进行能量最小化和 MD 松弛,提高结构可靠性。
-
功能机制分析:
-
通过 RMSD(均方根偏差)分析蛋白整体稳定性,RMSF(均方根涨落)识别柔性区域(如潜在的别构位点)。
-
优化靶点结构模型,确保其处于功能相关构象(如激酶的激活态)。
-
案例:MD 模拟揭示 BCR-ABL 激酶的 “DFG-in/out” 构象转换,指导伊马替尼等抑制剂设计。
实际应用中常结合多种方法提升结构预测准确性,例如:
-
同源建模 + AlphaFold2:
-
对有部分同源模板的蛋白,先用同源建模构建保守区域,再用 AlphaFold2 优化可变区域(如 GPCR 的跨膜区 vs. 胞外 loop 区)。
-
分子对接 + MD 模拟:
-
对接初筛高亲和力配体后,通过 MD 模拟验证复合物在动态环境中的结合稳定性(如配体是否从口袋中脱落)。
-
实验数据整合:
-
结合冷冻电镜(cryo-EM)低分辨率密度图或核磁共振(NMR)约束条件,优化计算模型(如用 RosettaCM 整合 EM 数据)。
目标蛋白特征 |
首选结构模拟方法 |
工具 / 数据库 |
精度与耗时 |
有同源模板(≥30% 序列同源) |
同源建模(Modeller) |
PDB、BLAST |
高,耗时 1-5 天 |
无同源模板(<20% 同源) |
AlphaFold2 + 从头建模 |
AlphaFold DB、Rosetta |
较高,耗时数小时 |
靶点 - 配体结合预测 |
分子对接(AutoDock Vina) |
ZINC、DrugBank |
中等,秒级 / 分子 |
动态构象分析 |
分子动力学(GROMACS) |
CHARMM 力场 |
低 - 中等,耗时数天 |
通过组合使用上述方法,可系统解决靶点结构未知、结合机制模糊等关键问题,为后续药物设计提供可靠的结构基础。