CN109086565B - 一种基于残基间接触约束的蛋白质结构预测方法 - Google Patents
一种基于残基间接触约束的蛋白质结构预测方法 Download PDFInfo
- Publication number
- CN109086565B CN109086565B CN201810763135.1A CN201810763135A CN109086565B CN 109086565 B CN109086565 B CN 109086565B CN 201810763135 A CN201810763135 A CN 201810763135A CN 109086565 B CN109086565 B CN 109086565B
- Authority
- CN
- China
- Prior art keywords
- conformation
- residue
- population
- contact
- residues
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000000455 protein structure prediction Methods 0.000 title claims abstract description 14
- 239000012634 fragment Substances 0.000 claims abstract description 26
- 238000005070 sampling Methods 0.000 claims abstract description 9
- 238000011156 evaluation Methods 0.000 claims abstract description 6
- 230000035772 mutation Effects 0.000 claims abstract description 6
- 230000008569 process Effects 0.000 claims description 10
- 229910052717 sulfur Inorganic materials 0.000 claims description 9
- 238000006467 substitution reaction Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 108090000623 proteins and genes Proteins 0.000 description 41
- 102000004169 proteins and genes Human genes 0.000 description 41
- 150000001413 amino acids Chemical class 0.000 description 6
- 238000005457 optimization Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- AMWRITDGCCNYAT-UHFFFAOYSA-L hydroxy(oxo)manganese;manganese Chemical compound [Mn].O[Mn]=O.O[Mn]=O AMWRITDGCCNYAT-UHFFFAOYSA-L 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 238000001225 nuclear magnetic resonance method Methods 0.000 description 2
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 description 1
- 102000036675 Myoglobin Human genes 0.000 description 1
- 108010062374 Myoglobin Proteins 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 101710100170 Unknown protein Proteins 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000002884 conformational search Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229910001882 dioxygen Inorganic materials 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052750 molybdenum Inorganic materials 0.000 description 1
- 239000011733 molybdenum Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Substances N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen(.) Chemical compound [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000000135 prohibitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
一种基于残基间接触约束的蛋白质结构预测方法,包括以下步骤:首先利用RaptorX‑Contact预测查询序列的残基间距离接触信息,构建片段库;其次采用禁忌搜索方法对种群构象初始化,建立基于残基间接触约束的评价函数,设计交叉变异策略;最后根据残基间距离约束分值实现种群更新,利用残基间距离约束能够有效地提高算法采样能力、搜索效率,进而得到结构更加紧凑、能量更低的构象。本发明提供一种预测精度较高的蛋白质结构预测方法。
Description
技术领域
本发明涉及生物信息学、智能信息处理、计算机应用领域、蛋白质三级结构预测,尤其涉及的是一种基于残基间接触约束的蛋白质结构预测方法。
背景技术
蛋白质是生命体的重要组成部分,是生命活动的承担者。蛋白质的基本组成单元是氨基酸,自然界中常见的氨基酸有20多种,蛋白质是由碳、氢、氧、氮组成,一般蛋白质可能还会含有磷、硫、铁、锌、铜、硼、锰、碘、钼等,氨基酸是由中心碳原子及其相连的氨基、羧基、氢原子以及氨基酸的侧链组成,氨基酸经过脱水缩合形成肽键,由肽键连接起来的氨基酸形成一条长链,即为蛋白质。
蛋白质分子在生物细胞化学反应过程中起着至关重要的作用。它们的结构模型和生物活性状态对我们理解和治愈多种疾病有重要的意义。蛋白质只有折叠成特定的三维结构才能产生其特有的生物学功能。要了解蛋白质的功能,就必须获得其三维空间结构。因此,获得蛋白质的三维结构对人类来说是至关重要的,1961年,Anfinsen提出了氨基酸序列决定蛋白质三维结构这一开创新的理论。而三维结构直接决定了蛋白质的生物性功能,所以人们对蛋白质的三维结构产生了浓厚兴趣并展开研究。国外学者肯德鲁和佩鲁茨对肌血蛋白和血红蛋白进行了结构分析,得到其蛋白质三维结构,是人类第一次测定蛋白质的三维结构,二人借此夺得年诺贝尔化学奖。此外,英国晶体学家Bernal与1958年提出了蛋白质四级结构的概念,将其定义为蛋白质一级结构、二级结构以及三级结构的延伸发展。多维核磁共振方法和射线晶体方法是近些年来发展起来的两个最主要的测定蛋白质结构的实验方法。多维核磁共振方法是将蛋白质放在水中,利用核磁共振直接测定其三维结构的方法。而射线晶体方法是目前为止最有效的蛋白质三维结构测定手段。到前为止,使用这两种方法测定的蛋白质占了已测蛋白质中的绝大比例。由于采用实验方法的条件有限、时间有限,需要花费大量的人力和物力,而且测定的速度远远跟不上序列的测定速度,所以急需一种既不依赖化学实验,又具有一定准确率的预测方法。这样如何简便、快速、高效地对未知蛋白质进行三维结构预测,成为研究者的棘手问题。在理论探索和应用需求的双重推动下,依据提出的蛋白质一级结构决定蛋白质三维结构的理论,利用计算机设计适当的算法,以序列为起点,三维结构为目标的蛋白质结构预测自20世纪末蓬勃发展。
以序列为起点,利用计算机和优化算法预测蛋白质的三维结构被称之为从头预测。从头预测方法直接基于蛋白质物理或知识能量模型,利用优化算法在构象空间搜索全局最低能量构象解。构象空间优化(或称采样)方法是目前制约蛋白质结构从头预测精度最关键的因素之一。优化算法应用于从头预测采样过程必须首先解决以下三个方面的问题:(1)能量模型的复杂性。蛋白质能量模型考虑分子体系成键作用以及范德华力、静电、氢键、疏水等非成键作用,致使其形成的能量曲面极其粗糙,局部极小解数量随着序列长度的增加呈指数增长;能量模型的漏斗特性也必然会产生局部高能量障碍,导致算法极易陷入局部解。(2)能量模型高维特性。就目前而言,从头预测方法只能应对尺寸较小的目标蛋白,一般不超过100。对尺寸超过150残基以上的目标蛋白,现有优化方法均无能为力。这也就进一步说明了随着尺寸规模的增加,必然造成维数灾问题,完成如此浩瀚的构象搜索过程所涉及的计算量是目前最先进的计算机也难以承受的。(3)能量模型的不精确性。对于蛋白质这类复杂的生物大分子,除了考虑各种物理成键和知识推理的作用之外,还要考虑它与周围溶剂分子的相互作用,目前还无法给出精确的物理描述。考虑到计算代价问题,近十年来研究者陆续提出了一些基于物理的力场简化模型(AMBER,CHARMM等)、基于知识的力场简化模型(Rosetta,QUARK等)。然而,我们还远远无法构建起能引导目标序列朝正确方向折叠的足够精确力场,导致数学上的最优解并不一定对应于目标蛋白的天然态结构;此外,模型的不精确性也必然会导致无法对算法性能进行客观地分析,从而阻碍了高性能算法在蛋白质结构从头预测领域中的应用。
因此,现在的蛋白质结构预测方法在预测精度和能量函数方面存在着缺陷,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法能量函数不精确和预测精度较低的缺陷,本发明提供一种预测精度较高的基于残基间接触约束的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于残基间接触约束的蛋白质结构预测方法,所述方法包括以下步骤:
1)输入查询序列,并利用RaptorX-Contact(http://raptorx.uchicago.edu/ ContactMap)预测查询序列的残基间距离接触信息;
2)设置初始种群规模NP、最大迭代次数Gen、交叉概率CR、片段组装次数M,输入查询序列、片段库、残基间接触信息,迭代次数g=0;
3)采用禁忌搜索的方法初始化种群,对种群中每个构象Ci做以下操作,其中i∈[1,NP]是种群中构象索引值,过程如下:
3.1)对构象Ci进行M次片段组装,并且记录片段组装时所用的片段;
3.2)设置构象Ci片段组装时所用的片段对Cj为禁忌采样片段,其中j∈[1,NP]且j≠i;
4)构象交叉,操作如下:
4.1)选第i个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到4.2),否则跳至步骤5);
4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;
4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基的二级结构类型S,S∈{H,E,L},H、E和L分别代表螺旋、片层、无规则折叠;
4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到另一个交叉点处残基的二级结构S′≠S,S′∈{H,E,L},产生两个新构象C′i和C′j;
5)构象变异,对构象C′i和C′j,变异过程如下:
5.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j;
5.2)分别对构象C″i和C″j求残基间距离约束分值Eco:
5.3)从构象C″i和C″j中选择最高的残基间距离约束分值E′co对应的构象作为变异成功构象;
6)基于残基间接触约束进行选择,过程如下:
6.1)对种群中的每个构象求残基间距离约束分值Eco,并求出最小的残基间距离约束分值E″co;
6.2)如果E′co大于E″co,则用E′co对应的构象替换E″co对应得构象实现种群更新,否则种群保持不变;
7)g=g+1,判断是否达到最大迭代次数Gen,若不满足条件终止条件,则遍历种群执行步骤4),否则输出最后预测结果。
本发明的技术构思为:一种基于残基间接触约束的蛋白质结构预测方法,包括以下步骤:首先利用RaptorX-Contact预测查询序列的残基间距离接触信息,构建片段库;其次采用禁忌搜索方法对种群构象初始化,建立基于残基间接触约束的评价函数,设计交叉变异策略;最后根据残基间距离约束分值实现种群更新,利用残基间距离约束能够有效地提高算法采样能力、搜索效率,进而得到结构更加紧凑、能量更低的构象。
本发明的有益效果为:构象空间采样能力较强、能够有效地使得有潜力的构象被保存下来进而提高预测精度。
附图说明
图1是蛋白质1AOY残基间接触分布图。
图2是蛋白质1AOY利用基于残基间接触约束的蛋白质结构预测方法预测得到的三维结构示意图。
具体实施方式
下面结合附图对本发明做进一步描述。
参照图1和图2,一种基于残基间接触约束的蛋白质结构预测方法,包括以下步骤:
1)输入查询序列,并利用RaptorX-Contact(http://raptorx.uchicago.edu/ ContactMap)预测查询序列的残基间距离接触信息;
2)设置初始种群规模NP、最大迭代次数Gen、交叉概率CR、片段组装次数M,输入查询序列、片段库、残基间接触信息,迭代次数g=0;
3)采用禁忌搜索的方法初始化种群,对种群中每个构象Ci做以下操作,其中i∈[1,NP]是种群中构象索引值,过程如下:
3.1)对构象Ci进行M次片段组装,并且记录片段组装时所用的片段;
3.2)设置构象Ci片段组装时所用的片段对Cj为禁忌采样片段,其中j∈[1,NP]且j≠i;
4)构象交叉,操作如下:
4.1)选第i个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到4.2),否则跳至步骤5);
4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;
4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基的二级结构类型S,S∈{H,E,L},H、E和L分别代表螺旋、片层、无规则折叠;
4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到另一个交叉点处残基的二级结构S′≠S,S′∈{H,E,L},产生两个新构象C′i和C′j;
5)构象变异,对构象C′i和C′j,变异过程如下:
5.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j;
5.2)分别对构象C″i和C″j求残基间距离约束分值Eco:
5.3)从构象C″i和C″j中选择最高的残基间距离约束分值E′co对应的构象作为变异成功构象;
6)基于残基间接触约束进行选择,过程如下:
6.1)对种群中的每个构象求残基间距离约束分值Eco,并求出最小的残基间距离约束分值E″co;
6.2)如果E′co大于E″co,则用E′co对应的构象替换E″co对应得构象实现种群更新,否则种群保持不变;
7)g=g+1,判断是否达到最大迭代次数Gen,若不满足条件终止条件,则遍历种群执行步骤4),否则输出最后预测结果。
本实施例以序列长度为78的α/β折叠蛋白质1AOY为实施例,基于残基间接触约束的蛋白质三级结构预测方法,所述方法包括以下步骤:
1)输入查询序列,并利用RaptorX-Contact(http://raptorx.uchicago.edu/ ContactMap)预测查询序列的残基间距离接触信息;
2)设置初始种群规模100、最大迭代次数1000、交叉概率0.5、片段组装次数2000,输入查询序列、片段库、残基间接触信息,迭代次数g=0;
3)采用禁忌搜索的方法初始化种群,对种群中每个构象Ci做以下操作,其中i∈[1,100]是种群中构象索引值,过程如下:
3.1)对构象Ci进行2000次片段组装,并且记录片段组装时所用的片段;
3.2)设置构象Ci片段组装时所用的片段对Cj为禁忌采样片段,其中j∈[1,100且j≠i;
4)构象交叉,操作如下:
4.1)选第i个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于0.5,则跳到4.2),否则跳至步骤5);
4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;
4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基的二级结构类型S,S∈{H,E,L},H、E和L分别代表螺旋、片层、无规则折叠;
4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到另一个交叉点处残基的二级结构S′≠S,S′∈{H,E,L},产生两个新构象C′i和C′j;
5)构象变异,对构象C′i和C′j,变异过程如下:
5.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j;
5.2)分别对构象C″i和C″j求残基间距离约束分值Eco:
5.3)从构象C″i和C″j中选择最高的残基间距离约束分值E′co对应的构象作为变异成功构象;
6)基于残基间接触约束进行选择,过程如下:
6.1)对种群中的每个构象求残基间距离约束分值Eco,并求出最小的残基间距离约束分值E″co;
6.2)如果E′co大于E″co,则用E′co对应的构象替换E″co对应得构象实现种群更新,否则种群保持不变;
7)g=g+1,判断是否达到最大迭代次数1000,若不满足条件终止条件,则遍历种群执行步骤4),否则输出最后预测结果。
以上说明是本发明以1AOY蛋白质为实例所得出的优良效果,显然本发明不仅适合上述实施例,在不偏离本发明基本内容所涉及范围的前提下对其做各种变形和改进,不应排除在本发明的保护范围之外。
Claims (1)
1.一种基于残基间接触约束的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:
1)输入查询序列,并利用RaptorX-Contact预测查询序列的残基间距离接触信息;
2)设置初始种群规模NP、最大迭代次数Gen、交叉概率CR、片段组装次数M,输入查询序列、片段库、残基间接触信息,迭代次数g=0;
3)采用禁忌搜索的方法初始化种群,对种群中每个构象Ci做以下操作,其中i∈[1,NP]是种群中构象索引值,过程如下:
3.1)对构象Ci进行M次片段组装,并且记录片段组装时所用的片段;
3.2)设置构象Ci片段组装时所用的片段对Cj为禁忌采样片段,其中j∈[1,NP]且j≠i;
4)构象交叉,操作如下:
4.1)选第i个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则跳到4.2),否则跳至步骤5);
4.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;
4.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基的二级结构类型S,S∈{H,E,L},H、E和L分别代表螺旋、片层、无规则折叠;
4.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到另一个交叉点处残基的二级结构S′≠S,S′∈{H,E,L},产生两个新构象C′i和C′j;
5)构象变异,对构象C′i和C′j,变异过程如下:
5.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j;
5.2)分别对构象C″i和C″j求残基间距离约束分值Eco:
5.3)从构象C″i和C″j中选择最高的残基间距离约束分值E′co对应的构象作为变异成功构象;
6)基于残基间距离约束进行选择,过程如下:
6.1)对种群中的每个构象求残基间距离约束分值Eco,并求出最小的残基间距离约束分值E″co;
6.2)如果E′co大于E″co,则用E′co对应的构象替换E″co对应得构象实现种群更新,否则种群保持不变;
7)g=g+1,判断是否达到最大迭代次数Gen,若不满足条件终止条件,则遍历种群执行步骤4),否则输出最后预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810763135.1A CN109086565B (zh) | 2018-07-12 | 2018-07-12 | 一种基于残基间接触约束的蛋白质结构预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810763135.1A CN109086565B (zh) | 2018-07-12 | 2018-07-12 | 一种基于残基间接触约束的蛋白质结构预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109086565A CN109086565A (zh) | 2018-12-25 |
CN109086565B true CN109086565B (zh) | 2021-11-23 |
Family
ID=64837595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810763135.1A Active CN109086565B (zh) | 2018-07-12 | 2018-07-12 | 一种基于残基间接触约束的蛋白质结构预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109086565B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109658979B (zh) * | 2019-01-09 | 2021-06-18 | 浙江工业大学 | 一种基于片段库信息增强的蛋白质结构预测方法 |
CN111815036B (zh) * | 2020-06-23 | 2022-04-08 | 浙江工业大学 | 一种基于多残基接触图协同约束的蛋白质结构预测方法 |
CN112085246B (zh) * | 2020-07-22 | 2024-06-21 | 浙江工业大学 | 一种基于残基对距离约束的蛋白质结构预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017079836A1 (en) * | 2015-11-09 | 2017-05-18 | The University Of British Columbia | Systems and methods for predicting misfolded protein epitopes by collective coordinate biasing |
CN107622182A (zh) * | 2017-08-04 | 2018-01-23 | 中南大学 | 蛋白质局部结构特征的预测方法及系统 |
CN107633159A (zh) * | 2017-08-21 | 2018-01-26 | 浙江工业大学 | 一种基于距离相似度的蛋白质构象空间搜索方法 |
WO2018081289A2 (en) * | 2016-10-25 | 2018-05-03 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Prefusion piv f immunogens and their use |
-
2018
- 2018-07-12 CN CN201810763135.1A patent/CN109086565B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017079836A1 (en) * | 2015-11-09 | 2017-05-18 | The University Of British Columbia | Systems and methods for predicting misfolded protein epitopes by collective coordinate biasing |
WO2018081289A2 (en) * | 2016-10-25 | 2018-05-03 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Prefusion piv f immunogens and their use |
CN107622182A (zh) * | 2017-08-04 | 2018-01-23 | 中南大学 | 蛋白质局部结构特征的预测方法及系统 |
CN107633159A (zh) * | 2017-08-21 | 2018-01-26 | 浙江工业大学 | 一种基于距离相似度的蛋白质构象空间搜索方法 |
Non-Patent Citations (2)
Title |
---|
" Improved protein residue-residue contacts prediction using learning-to-rank";Jing X;《2016 IEEE International Conference on Bioinformatics and Biomedicine》;20161231;第116-121页 * |
"蛋白质三级结构预测算法综述";王超;《计算机学报》;20180430;第760-779页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109086565A (zh) | 2018-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Deng et al. | Protein structure prediction | |
Feinauer et al. | Improving contact prediction along three dimensions | |
Lin et al. | The prediction of protein structural class using averaged chemical shifts | |
CN109086565B (zh) | 一种基于残基间接触约束的蛋白质结构预测方法 | |
Wang et al. | Improved fragment sampling for ab initio protein structure prediction using deep neural networks | |
Márquez-Chamorro et al. | Soft computing methods for the prediction of protein tertiary structures: A survey | |
CN109215732B (zh) | 一种基于残基接触信息自学习的蛋白质结构预测方法 | |
Liu et al. | CGLFold: a contact-assisted de novo protein structure prediction using global exploration and loop perturbation sampling algorithm | |
CN108846256B (zh) | 一种基于残基接触信息的群体蛋白质结构预测方法 | |
CN109101785B (zh) | 一种基于二级结构相似性选择策略的蛋白质结构预测方法 | |
Hu et al. | TargetDBP+: enhancing the performance of identifying DNA-binding proteins via weighted convolutional features | |
CN109360599B (zh) | 一种基于残基接触信息交叉策略的蛋白质结构预测方法 | |
CN117976035A (zh) | 一种融合特征的深度学习网络的蛋白质sno位点预测方法 | |
CN109300506B (zh) | 一种基于特定距离约束的蛋白质结构预测方法 | |
CN109872770B (zh) | 一种结合排挤度评价的多变异策略蛋白质结构预测方法 | |
Nanni et al. | Set of approaches based on 3D structure and position specific-scoring matrix for predicting DNA-binding proteins | |
Saraswathi et al. | Fast learning optimized prediction methodology (FLOPRED) for protein secondary structure prediction | |
CN109378035B (zh) | 一种基于二级结构动态选择策略的蛋白质结构预测方法 | |
CN109326320B (zh) | 一种系综构象选择策略自适应的蛋白质结构预测方法 | |
CN112085245B (zh) | 一种基于深度残差神经网络的蛋白质残基接触预测方法 | |
CN109346128B (zh) | 一种基于残基信息动态选择策略的蛋白质结构预测方法 | |
CN109002691B (zh) | 一种基于玻尔兹曼更新策略的蛋白质结构预测方法 | |
CN109300504B (zh) | 一种基于多变异精英选择的蛋白质结构预测方法 | |
CN109243526B (zh) | 一种基于特定片段交叉的蛋白质结构预测方法 | |
Geethu et al. | Improved 3-D protein structure predictions using deep ResNet model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |