蛋白质—蛋白质对接方法的研究

蛋白质—蛋白质对接方法的研究

李林[1]2011年在《蛋白质—蛋白质对接方法的研究和应用》文中指出大部分蛋白质需要通过与其他蛋白质或分子的相互作用来完成其生命功能,对蛋白质-蛋白质相互作用的研究需要蛋白质复合体的叁维结构。与测量蛋白质单体结构相比,实验上测定复合体叁维结构相对比较困难。因此,目前实验测定的蛋白质单体的结构数量已经远远大于复合体的结构数量。通过蛋白质-蛋白质对接方法可以帮助预测蛋白质复合体的叁维结构。在很多蛋白质-蛋白质对接方法中,几何匹配是最为重要的打分方式,因此如果能够改进目前的几何匹配模型,将会对很多对接方法都有所帮助。正确的生物学信息可以帮助预测复合体叁维结构,错误的生物学信息会导致预测失败,所以不可靠的生物学信息难以被直接利用。许多蛋白质分子对接方法都是基于快速傅里叶变换(Fast Fourier Transform, FFT)算法。基于FFT方法的对接算法都以几何匹配打分为主要的打分依据。我们在传统的FFT对接方法的基础上,开发了基于原子溶剂化参数(Atomic Solvation Parameters, ASP)模型的新的对接方法——ASPDock。ASPDock用ASP打分替代了FFT方法中原有的几何匹配打分。FFT方法中的ASP打分在计算方法上与纯几何匹配有一些相似,但比几何匹配有着更加明确的物理意义。纯几何匹配只是反映了蛋白质复合体的几何性质,而ASP模型能够成功地计算蛋白质-蛋白质复合物的结合自由能。我们使用ASPDock计算了21组实验已经测定了结合能的复合体。当格点大小取值为1 ?时,得到的21组复合物的ASP打分与实验测定的结合能之间的相关性(r≈0.69)要高于几何匹配与实验结果的相关性(r≈0.48)。这个结果表明,ASPDock的打分方式要比几何匹配的打分方式更为可靠。在针对Benchmark3.0的124组复合体的测试中,ASPDock的预测成功率也明显优于几何匹配。在蛋白质对接的算法中,利用可靠的生物学信息可以有效地提高预测的成功率。因此很多小组开发了各种不同的理论方法来预测蛋白质的相互作用位点信息。然而,目前各个小组的理论预测方法并不是完全可靠的。为了能够利用能够这些不完全可靠的理论预测方法来帮助对接算法,我们开发了一个软限制(softly restricting method,SRM)的方法来利用这些信息。SRM方法在ASPDock的基础上,通过提高某些关键残基的权重的方式来使采样倾向于在集中那些关键残基附近。SRM方法对正确的信息非常敏感,而对错误的信息不太敏感,这样可以有效地降低使用不可靠信息的风险性。我们在99组蛋白质复合物上进行了测试,结果表明,即使利用有风险的理论预测位点信息,SRM方法依然可以提高预测的成功率和增加预测到的近天然态结构的数目。ASPDock和SRM方法也在CAPRI(Critical Assessments of PRediction of Interactions)的第18轮和第19轮比赛中取得了成功。通过ASPDock和SRM方法的结合使用,我们预测得到了CAPRI T40和T41的高精度结构,LRMSD分别为2.35 ?和1.41 ?.

李春华[2]2003年在《蛋白质—蛋白质对接方法的研究》文中研究指明蛋白质-蛋白质相互作用与识别的研究是分子生物学领域的重要课题。由于实验测定蛋白质复合物结构的困难,目前,通过计算机模拟来预测分子间结合模式的对接方法受到了很大的关注。分子对接的最终目的是预测未知复合物结构的受体和配体之间的结合情况,对这种自由态分子的对接问题,在一定程度上考虑分子的柔性是非常必要的。然而,在蛋白质-蛋白质对接中,体系原子数和自由度数的增加使模拟复合物形成中的构象变化十分困难。另外,搜索过程可能产生数百万的对接构象,在用精细的能量函数打分之前,如何对这些结构进行初步筛选以得到尽可能多的近天然构象是目前方法研究中极具挑战性的问题。 使用打分函数的目的,是在合理的时间内对结构作出有效评价,以区分出近天然构象。目前,很多对接算法所使用的打分函数是基于热力学假设,即天然蛋白质复合物的结构是结合自由能最低的构象。因此,发展一个计算快且足够准确的结合自由能计算方法是结构预测中十分重要的一步。 本文包括叁个部分。第一部分,针对自由态分子对接问题,提出了一个有效的蛋白质-蛋白质软对接方法;第二部分,在软对接方法的基础上,我们发展了一个依赖于复合物类型的分子对接算法;第叁部分是关于对接算法中打分函数的研究。论文的主要研究内容包括以下方面: (1)在Wodak和Janin的刚性对接算法基础上,针对自由态分子对接问题,提出了一个蛋白质-蛋白质软对接方法。采用简化蛋白模型:一个残基用一个球来表示,模拟分子的表面,并采用软化分子表面的方式考虑了分子的柔性。由于蛋白质表面氨基酸残基Arg、Lys、Asp、Glu和Met具有较大的柔性,因此, 北京工业大学工学博士学位论文一我们对蛋白质分子表面的这五种氨基酸模型作了修正,调整了残基球心的位置和半径的数值,使分子表面的氨基酸残基在对接时具有一定程度的可交迭性。在结构过滤中,将复合物界面残基成对偏好性引入到几何匹配过滤方法中,发展了双重过滤技术来筛选合理的结合模式。最后对这些保留下来的结构进行能量优化和打分排序以获得近天然结构(native-like structure)。打分函数中包括静电相互作用能、去水化自由能和范德华能。用该方法对26个蛋白质-蛋白质复合物体系作了测试,结果发现以上改进确实大大提高了自由态分子对接预测的成功率。其中,在胰蛋白酶-APPI复合物结构预测中,尽管抑制剂 APPI的 15号残基Arg侧链在复合物形成过程中发生了较大的构象变化,但其近天然结构仍然被找到了,并在打分中排在了第一位。 仅)在软对接方法的基础上,我们对过滤方案作了进一步的改进,得到了依赖于复合物类型的分子对接方法。根据复合物界面的特性,对蛋白酶-抑制剂类、抗原。抗体类和其它类复合物采用不同的过滤方法,其中考虑了界面几何匹配、疏水性和静电互补性。用该方法对46个蛋白质-蛋白质复合物体系进行了对接测试,其中有 25个蛋白酶-抑制剂类、11个抗体-抗原类、10个其它类型,结果全部找到了近天然结构,并有30个体系的近天然构象排在了前20位。与第一部分的软对接算法相比,依赖于复合物类型的对接方法抓住了不同类型复合物中分子间相互作用与识别的重要差异,能够在过滤中筛选到更多的近天然构象,提高了结构预测的成功率。 另外,采用该分子对接方法,我们对 2002年 CAPRI(Critical Assessment o7Prediction of Interactions)学术大会提供的叁种不同突变形式的骆驼 VHH抗体和胰腺a.淀粉酶分子之间相互作用与识别进行了预测(分别记作T04、T05和T06)。才据抗体分于的 CDRS(CO*plCmeflt盯ity DCtC*illiflg RCgioflS)与其抗原发生结合这一假设来限制抗体表面的搜索范围。在几何匹配过滤和静电相互作用能过滤后,对筛选得到的结构用最陡下降法优化,然后再进行打分排序。 互I 摘 要打分中考虑了去水化自由能和静电相互作用能,分别用修正的原子接触能模型和有限差分解泊松-玻尔兹曼方程方法(Finite Difference Polsson刁oltZmann,FDPB)来计算。在预测结果中,对T06,有两个近天然结构排在了前五位。可以认为此结构的预测是非常成功的,这也得到了CAPRI检测小组的肯定。对T04和 T05,尽管没有找到近天然构象,但预测也并不是完全失败的,在前五个结构中,我们各找到了两个这样的结构,其中抗体识别到了抗原决定簇一半以上的氨基酸残基,但抗体相对于抗原的方位是错误的。与其他参赛小组相比,我们的预测结果还是可信的。这也进一步说明依赖于复合物类型的软对接算法与相关的生物信息相结合能够对一些复合物的结构作出很好的预测,可以作为研究分子识别的有效工具。 ()通过分析蛋白质分子间静电、疏水作用和嫡效应与相对于蛋白质晶体结构主链原子的均方根偏差(ILMSD)的相关性,定量地考察了它们在蛋白质-蛋?

李海鸥[3]2014年在《蛋白质—肽段全柔性对接的并行计算研究》文中认为蛋白质-肽段复合物相关的结构信息对于新药的研制和设计有非常重要的作用。蛋白质和肽段的计算对接方法可以为用实验方法探究蛋白质-肽段交互作用做补充。现实世界中,蛋白质-肽段对接过程包含叁个并行的过程:从头折迭肽段,肽段与受体的对接和靠近肽段的一些受体柔性区域的优化。一些现有的计算方法已经被用在这几个过程中自由度的采样,但这些方法通常都是以顺序的机制触发运行。蛋白质-肽段对接时受体的骨架柔性问题一直以来都是计算生物学中的一个挑战。目前,绝大多数的对接都是一种半柔性对接方法,然而真实的对接过程中受体也会产生构象变化,包括侧链运动、骨架运动或其它突变。本文先引入一种柔性对接方法,该方法显式地把受体界面处的柔性区域融入到蛋白质-肽段的对接过程中。随后,本文又提出了一种并行化的方法,这个方法将受体柔性区域的优化并行结合到蛋白质-肽段的对接过程中,并将主要的叁个过程并行化。并行化的对接方式能够更好地模拟真实的蛋白质-肽段对接过程。本文使用了多个Unbound蛋白质-肽段对接案例来评估本文提出的两种方法。结果的分析证明受体柔性区域的显着扰动可以提升复合物界面建模的精确性,同时结合并行中的相关采样有助于为结构预测构建能量漏斗。

奚赫然[4]2009年在《蛋白质对接的研究》文中提出随着“后基因组时代”的到来,蛋白质分子对接成为蛋白质组学主要的研究方向。蛋白质分子对接是两个或多个蛋白质分子通过几何匹配和能量匹配相互识别的过程,要求两个分子要充分接近并采取合适的取向以使二者在必要的部位相互契合,发生相互作用,继而通过适当的构象调整,得到一个稳定的复合物构象,在药物设计中有十分重要的意义。而生物实验测定蛋白质复合物相对困难,所以,用计算机预测分子间的结合模式倍受关注。本文包括叁个部分。首先,从蛋白质数据库中提取两个蛋白质,称分子量较大的为受体,分子量较小的为配体,受体分子和配体分子的名称分别为5CHA和2OVO,同时定义配体分子和受体分子的数据模型和存储结构;然后,利用几何互补的原则给出了基于网格匹配的对接算法,该算法要求首先将受体和配体植入网格中,再进行全空间进行搜索,寻找对接位置;最后,搜索将得到的大量对接位置,本文将所有位置信息整理、过滤和打分,并以数字形式表现出来。

李海鸥[5]2017年在《基于机器学习技术的蛋白质—配体对接关键计算问题研究》文中认为蛋白质是人体细胞组织的重要组成部分,也是生命活动的主要承担者。多个蛋白质结合在一起形成稳定的复合物后才能在人体机能的调节中发挥作用。蛋白质-配体对接技术就是研究如何通过计算技术预测蛋白质-配体复合物稳定的空间结构。现阶段蛋白质-配体对接研究主要面临两个难题:受体和配体在对接过程中除相对位置的改变外自身结构也会发生变化,因此受体和配体自身结构柔性的处理是一个难题;其次,对接结合位点的准确度会直接影响受体和配体对接时采样空间的大小,然而目前没有一个统一的、高精度的结合位点预测方法。结合以上两个关键计算问题,本文的主要内容围绕以下四点展开:1.蛋白质-配体对接局部柔性的优化研究本实验将蛋白质-配体对接界面处的柔性区域划分成多段loop,并基于循环坐标下降法开发了一种随机游走的loop采样算法。该采样算法在保持对接界面上的loop与其N-端和C-端残基快速闭合的前提下,可以快速的在采样空间中向目标位置移动。本实验将该loop采样算法引入到一个并行的蛋白质-肽段全柔性对接方法中,替换了原始的受体柔性区域采样算法,结果表明新引入的采样算法取得了更好的对接结果。2.蛋白质-配体对接骨架柔性的优化研究本实验从蛋白质序列上提取了丰富的特征信息,同时针对蛋白质二面角预测问题的自身特点寻找出两种全新的特征,在一组独立的蛋白质序列集上对这些特征值进行编码,并封装成供机器学习方法使用的训练数据和测试数据。计算方法上,本研究使用了两种深度递归神经网络和两种非递归神经网络。最终,我们构建了一个基于多种深度学习模型的蛋白质二面角预测框架。多组验证实验结果表明,本研究设计的方法可以更加精确地预测蛋白质二面角,为蛋白质对接中骨架柔性的处理提供了一种非常有效的解决思路。3.蛋白质-配体对接全原子柔性的优化研究本实验提出了一种蛋白质整体结构重构的方法,可以为ensemble docking提供受体、配体潜在的构象集合。研究中,我们使用了深度学习模型中的多层堆迭自动编码器模型,数据集是目标蛋白质序列的同源模板结构,特征数据取自于对齐后的同源模板结构的叁维坐标信息。实验结果表明,本研究提出的蛋白质结构重构模型可以有效的避免基于模板的传统蛋白质结构预测方法中的采样算法复杂、打分函数不准确的问题。4.蛋白质-配体结合位点预测研究本文首次提出了基于递归神经网络的蛋白质-配体对接结合位点的预测方法。该研究问题中,我们使用了两组包含unbound和bound复合物的混合数据集,并从蛋白质序列上提取了7种数据的特征值。验证实验主要从四个方面展开,分别是:不平衡数据的处理方式、dropout控制模型过拟合、递归神经网络方法与普通机器学习方法对比以及多种递归神经网络之间的比较。实验结果表明,本文提出的基于递归神经网络的蛋白质-配体结合位点预测方法相较普通的机器学习方法取得了更高的预测精度。本文的主要贡献在于对蛋白质-配体对接关键计算问题中的柔性优化处理和结合位点判定进行了深入的研究和探索,实验方法上本文既开发了基于运动学的loop采样算法,也使用了多种流行的深度学习模型。实验结果表明,这些方法的研究和所取得的成果有助于深度学习在蛋白质结构和功能预测问题方面的进一步研究,同时对今后基于深度学习的生物信息学问题研究具有重要的参考价值。

陈荣[6]2014年在《蛋白质柔性对接中计算技术研究》文中提出蛋白质复合物在生物体内起到信号传导、物质输送等很多生理功能。由于蛋白质的叁维结构决定其功能,故通过计算手段预测蛋白质结构可以帮助在实验结构未知的情况下对其功能的理解。但目前复合物结构预测仍是一项艰巨的任务。由于蛋白质在复合过程中常发生局部结构变化,所以预测复合物结构时柔性处理就变得异常困难。本文研究一个柔性区域识别问题以及应用图概率模型到柔性对接问题中。首先研究了GPCR结构中柔性区域的识别问题,因为GPCR在制药领域中占有极其重要的地位。跨膜螺旋结构是GPCR非常显着的特征之一,然而螺旋结构往往存在柔性形变。这些柔性形变会导致GPCR结构预测精度不高,那么对螺旋柔性形变识别预测至关重要。本文根据螺旋序列相似度矩阵进行聚类,用连续型vonMises概率分布来对每个类中柔性形变角度集建模。训练后的概率模型只需十五次采样,就有采样结果接近天然螺旋的形变角度,能够很好的帮助螺旋的柔性识别预测。提高柔性形变识别预测精度,能够帮助GPCR结构预测和对接过程中的柔性处理。其次在蛋白质-蛋白质对接协议Rosetta Dock基础上加入了骨架柔性运动来加大采样空间以提高对接精度。要提高复合物的预测精度,不仅要提高柔性对接的采样能力,还要提升能量打分函数对对接结果的挑选能力。由于大量柔性的引入导致对接结果采样空间变大而使得能量分布宽度加大,给能量函数提出了更大的挑战。本文采用概率模型matrix Bingham-von Mises-Fisher对残基交互图建模,后使用该概率模型回归对候选结构进行概率打分。由于残基交互图可以把生化知识在结构上定性化表达,能够作为结构挑选的依据。本文的模型方法在能量函数挑选效果不好的对接案例中,能够作为能量函数进行柔性对接结构筛选的辅助手段。

张媛[7]2014年在《考虑蛋白质柔性的分子对接方法与酰胺联苯醚类FTase抑制剂的构效关系研究》文中指出分子对接方法是基于结构的药物设计的有力工具之一,随着越来越多的蛋白质晶体结构被解析出来,分子对接方法也得到越来越多推广与运用。同时,现有分子对接方法存在的问题也被相继提出来,比如构象搜索不充分、打分函数不够精确、溶剂效应和蛋白质的柔性处理有限等。其中,如何合理处理蛋白质的柔性是分子对接方法研究中难点问题之一。鉴于此,本文以蛋白质与配体小分子结合前后的构象变化尺度为分子柔性尺度评判标准,通过统计分析,对现已解析出晶体结构的蛋白质按照柔性尺度进行聚类,为考虑蛋白质柔性的药物设计提供了数据支持。此外,本文选择部分关键残基柔性的蛋白质作为测试集,对本课题组前期发展的iFitDock和两个主流分子对接方法(AutoDock和Induced-Fit Docking)展开了测试评价,结果表明,iFitDock对配体和蛋白质活性构象的预测精度均显着高于其他分子对接方法,为考虑蛋白质柔性的分子对接方法的发展和完善提供了理论依据。作为一类重要的翻译后修饰酶,法尼基转移酶(Farnesyltransferase, FTase)对Ras蛋白的膜定位和生物功能的正常运作起着至关重要的作用,是重要的癌症治疗靶标。本课题组在前期的研究中,通过虚拟筛选方法,发现了若干靶向法尼基转移酶的小分子抑制剂。本文针对其中的酰胺联苯醚类抑制剂,采用分子对接方法,对其展开构效关系研究,并依此提出该类化合物的结构修饰策略,结合化学合成及生物测试,获得了一系列高活性的酰胺联苯醚类抑制剂。

常珊[8]2009年在《蛋白质结构预测方法学研究》文中研究表明随着人类基因组测序计划的完成,生命科学的重心开始转移到对基因的表达产物蛋白质的研究上来,蛋白质组学已成为后基因组时代的研究前沿和热点领域。蛋白质与配体相互作用以及蛋白质的结构与功能关系是后基因组时代研究的核心内容。研究蛋白质受体与配体间相互作用与识别对揭示细胞中蛋白质的分子生物学机理、计算机辅助药物设计和复合物结构预测都具有重要的意义。由于实验测定蛋白质复合物结构存在较大的困难,近年来,随着计算机处理能力的不断增强以及理论模拟方法的迅速发展和广泛应用,计算机分子模拟方法已经成为研究蛋白质受体与其配体相互作用机制的重要手段。本论文采用分子对接和氨基酸网络方法等分子模拟方法,对蛋白质间相互作用与识别机制进行了一系列基础性的研究工作。论文内容主要包括以下几个方面:(1)蛋白质分子对接打分函数的研究提出了两个打分函数。一个是针对Others类型蛋白质复合物的组合打分函数ComScore。ComScore由原子接触势、范德华和静电相互作用能组成,采用多元线性回归拟合权重。对CAPRI比赛的benchmark 1.0中的17个复合物的对接结构测试结果表明,该组合打分基本能够体现Others类型复合物的相互作用特征,反映出复合物形成前后的能量变化关系,具备一定的从大量采集构象中筛选获得有效结构的能力。ComScore被用于CAPRI的第9-12轮的打分比赛中,在第9轮和第11轮都取得了好的成绩。另一个是基于氨基酸网络的打分函数。蛋白质复合物拓扑结构给蛋白质-蛋白质相互作用机理的研究很多启示。在本论文中,建立了蛋白质的残基网络,其中蛋白质的残基被视为节点,残基之间的接触视为连接。根据残基类型将蛋白质复合物的残基网络分成两种类型,即疏水和亲水残基网络。分析这两种不同类型的网络,发现他们都具有小世界的性质。通过分析网络参量发现,正确结合的复合物构象比错误结合的结构具有更高的界面度值和更低的网络特征路径长度。这些性质反映出正确结合的复合物结构有更好的几何和残基类型互补,同时正确的结合模式对于保证天然蛋白质复合物的特征路径长度起着重要作用。此外,建立了两个基于网络参量的打分项,它们能够很好地反映复合物整体形状和残基类型互补特性。将基于网络的打分项与其他打分函数项进行组合后,提出了一个新的多项打分函数HPNCscore,它能够将RosettaDock组合打分函数的区分能力提高12%。上述工作能够扩展我们对蛋白质-蛋白质结合机制的了解,并可以用于蛋白质结构设计的工作。(2)蛋白质分子对接搜索方法的改进分子对接需要在尽量短的时间里搜索到能量低的结构,因此分子对接方法研究的另一个重要问题是快速有效的搜索算法,即采用新的理论和计算方法提升现有程序的计算效率。Autodock 3.0是一个被广泛采用的分子对接程序,它由美国Scripps研究所Olson等人开发,在预测蛋白质受体和配体间结合模式上取得了很好的成绩。本论文在分析Autodock 3.0串行程序的基础上提出并实现了5种不同的并行方案,从正确性、参数分析(包括5个不同输入参数)、并行进程数量的影响等多个角度对5个并行方案进行了测试和分析。在正确性测试中,并行方案五和原始串行程序分别应用于10个不同蛋白质-小分子体系的对接,对接结果比较证实了并行程序的正确性和可靠性。在参数分析测试中,通过改变能量评价次数、种群个体数、局部搜索概率、局部搜索迭代次数和对接次数等5个不同输入参数,分析了它们对不同方案的影响,这些测试将对并行程序在虚拟筛选中的应用起到指导作用。在并行进程数量测试中,第五个混合的并行方案由于结合多种方案的特点,随着进程数量的增加,程序依然能够充分合理地安排进程资源,保持较高的并行效率。并行化改造能够有效地提升Autodock分子对接软件的计算效率,将为计算机辅助药物设计和虚拟筛选提供一些帮助。另外,还采用蚁群算法对Autodock 3.0程序进行了改进,替换了原程序中进行全局搜索的遗传算法。在22个蛋白质-小分子体系上测试发现,蚁群算法能够有效地改善程序的搜索结果。同时,不管是否采用局部搜索的算法,蚁群算法比遗传算法都具有更好的性能和更快的收敛速度。新的优化算法-蚁群算法的引入将对分子对接软件的改进提供一些新的参考。(3)蛋白质氨基酸网络研究蛋白质分子的叁维结构可以被视为由氨基酸组成的复杂网络,对网络性质的分析能够帮助理解蛋白质结构和功能之间的关系。由于蛋白质的氨基酸网络是在蛋白质折迭过程中形成的,通常的网络模型难以解释其演化的机制。基于蛋白质折迭的观点,提出了一个氨基酸网络的演化模型。在此模型中,演化从天然蛋白质的氨基酸序列开始,由两个基本假设进行引导,即近邻偏好性规则和能量偏好性规则。研究发现近邻偏好性规则主要决定通常的网络性质,而能量偏好性规则主要决定特殊的生物学结构特征。应用于天然蛋白质体系发现,该模型能够很好地模拟出氨基酸网络的性质。另外,建立并研究了蛋白质保守残基的无向网络。标识蛋白质结合界面是蛋白质-蛋白质相互作用预测以及蛋白质分类的重要环节。在本论文中,蛋白质结构被视为一个无向网络,其中保守性残基为网络节点,残基之间的接触视为连接。研究发现,保守性残基网络具有介于规则网络和随机网络之间的聚集系数和特征路径长度,属于小世界类型的网络。蛋白质复合物界面的残基比表面残基通常具有大的度值和低的聚集系数。此外,还发现了保守残基的空间聚集是一个普遍现象。保守性残基网络的性质将能够给蛋白质-蛋白质界面预测提供一些新的参量。

黄一清[9]2014年在《蛋白质对接算法与实践》文中指出蛋白质-蛋白质相互作用与识别的研究是分子生物学领域的重要课题,其中一项重要的研究内容是蛋白质分子对接。由于实验测定蛋白质对接复合物结构比较困难,因此,通过计算机模拟预测分子间结合模式的对接算法受到极大关注。迄今为止已有比较成功的蛋白质对接预测算法如ZDOCK、AutoDOCK与Rosetta计算平台等。在很多蛋白质-蛋白质对接方法中,几何匹配是最为重要的打分方式,因此如果能够改进目前的几何匹配模型,将会对对接方法有所帮助。这些蛋白质对接算法各有其优缺点,普遍对计算的蛋白质对象有较高的敏感度。蛋白质对接算法有着广泛的应用。细胞内的很多重要生理过程如细胞信号传导、免疫反应、基因复制、转录、翻译以及细胞周期调控等,都是通过蛋白质复合体或蛋白质分子间相互作用来完成的,要充分理解和认识这些复杂生理过程,必须要解析蛋白质复合物结构并了解蛋白质相互作用过程发生的构象变化。蛋白质对接算法使用计算机模拟分子对接,最终生成预测的复合物构象,有的对接算法在运行期间还能够模拟计算出分子动力学范畴的各项指标,供进一步分析研究。本文主要贡献是针对蛋白质分子对接算法开展了算法的优化与算法的实践。考虑到对接算法采用几何匹配的打分方式,通过引入进化约束这一概念,改进了Rosetta SymDock在进行对接计算时的几何匹配模式,设计出了EcSymDock的算法。SymDock是Rosetta中的一项协议,用来通过蛋白质分子对接预测蛋白质多聚体的结构。该协议主要考虑到了多聚体的几何对称性这一特征。进化约束耦合(Evolutionary Coupling,EC)是通过特定蛋白质家族多重序列比对后的优化互信息的结果,它的结果表示了残基对之间的相互作用的程度。通过将EC信息与SymDock协议相结合,让EC在SymDock的低精度采样协议中发挥几何距离约束作用。经过对二聚体结构的对接测试,实验结果表明我们的算法确实在对接精度上有了明显的提高。开展蛋白质对接实践,借助于蛋白质对接算法,从能量的角度刻画了抗癌药物产生抗药性的原因。表皮生长因子受体(EGFR)的突变导致的抗药性已经在很大程度上限制了酪氨酸激酶抑制剂(TKI)在肺癌治疗方面的效用。在研究抗药性这一问题上,运用电子计算方法能够提供强有力的技术帮助人们分析。在我们的实验中,通过对突变EGFR与抑制剂复合物的分析,EGFR突变引起的抗药性特征被刻画成它与TKI结合的绑定释放能量。EGFR与受体药物分子作为复合物被用作AMBER进行分子动力学模拟,绑定释放能量也在这一步计算获得。通过分析,我们得出了绑定释放能量的高低决定抗药性强度的结论。

罗小虎[10]2011年在《蛋白质—蛋白质骨架柔性对接研究》文中进行了进一步梳理蛋白质-蛋白质对接是指在两个蛋白质分子之间试图找到最好匹配,蛋白质-蛋白质相互作用过程中通常会发生骨架构象变化,蛋白质-蛋白质骨架柔性对接就是设计相应的对接算法和协议来模拟蛋白质-蛋白质相瓦作用过程中的骨架构象变化,其重要意义在于高效可靠的蛋白质-蛋白质对接不仅是实验测定蛋白质复合物叁维结构的有益补充,更为重要的是,它能在分子层而解释现代医学中许多复杂的生命现象,是疾病诊断和新药设计与开发的有效途径和重要工具。本文研究蛋白质-蛋白质骨架柔性对接中的两个难点问题,即蛋白质-蛋白质相互作用过程中有可能发生骨架构象变化的柔性区域的预测,以及建立在柔性区域上的对接方法和对接计算协议。本文首先提出了一个通用的计算方法来自动识别蛋白质-蛋白质相互作用过程中的引起局部骨架构象变化的柔性环,以及引发蛋白质结构域发生位置变化的柔性铰链。其次,在所识别的柔性区域的基础上,根据柔性区域的属性,本文设计了两项对接计算实验,即柔性环能量最小化对接,和基于结构域装配的对接计算协议,评估了柔性区域识别精度的性能和不同计算协议上对接计算模型质量的性能。柔性环能量最小化对接针对一着名测试集进行了评测,本文对接计算结果及比较说明了,不论在选择模型的能量地形显现上,还是对接计算所产生模型的总体质量上,本文在自动识别柔性环上就环能量最小化对接协议所取得的对接计算结果,在许多算例上,都要好于参考对象不提供柔性骨架肽链片段而仅仅实行骨架能量最小化对接协议所取得的结果。对于该测试集上的每一个算例,本文对接计算结果集上令人满意的模型数几乎是其它对接程序所得结果的双倍,这些结果充分论证了,无论能量地形的显现与否,还是所生成的对接计算结果集的质量,本文在该测试集上的计算预测是可接受的,且在总体上是优于参考对象的。基于结构域装配的对接计算协议针对一个包含四个算例的测试集进行了评测,这四个算例都是国际公认的评测案例中的困难算例。在这四个对接计算实例上,在低分辨率阶段使用本文的基于结构域装配对接计算协议,以及在高分辨率阶段使用环能量最小化对接计算协议同样也获得了令人鼓舞的结果。其中,有一个算例在两种选择方法上都获得了能量地形;另外两个算例的对接计算结果集中的最优模型都达到了可接受精度模型的条件:而这四个中对接计算最困难的一个算例的对接计算结果集中最优模型的Fnat指标满足可接受精度模型的条件,而指标Lrmsd和Irmsd则接近于可接受精度模型的条件。本文所有对接计算结果证明了,蛋白质-蛋白质相互作用过程中,本文自动识别的骨架柔性区域能够显着改善对接计算所得模型的精度,以及本文设计的建立在所识别的不同属性的骨架柔性区域上的对接计算协议是正确可行的。

参考文献:

[1]. 蛋白质—蛋白质对接方法的研究和应用[D]. 李林. 华中科技大学. 2011

[2]. 蛋白质—蛋白质对接方法的研究[D]. 李春华. 北京工业大学. 2003

[3]. 蛋白质—肽段全柔性对接的并行计算研究[D]. 李海鸥. 苏州大学. 2014

[4]. 蛋白质对接的研究[D]. 奚赫然. 哈尔滨工程大学. 2009

[5]. 基于机器学习技术的蛋白质—配体对接关键计算问题研究[D]. 李海鸥. 苏州大学. 2017

[6]. 蛋白质柔性对接中计算技术研究[D]. 陈荣. 苏州大学. 2014

[7]. 考虑蛋白质柔性的分子对接方法与酰胺联苯醚类FTase抑制剂的构效关系研究[D]. 张媛. 华东理工大学. 2014

[8]. 蛋白质结构预测方法学研究[D]. 常珊. 北京工业大学. 2009

[9]. 蛋白质对接算法与实践[D]. 黄一清. 苏州大学. 2014

[10]. 蛋白质—蛋白质骨架柔性对接研究[D]. 罗小虎. 苏州大学. 2011

标签:;  ;  ;  ;  ;  

蛋白质—蛋白质对接方法的研究
下载Doc文档

猜你喜欢