一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多残基间距离图约束的蛋白质结构预测方法

2022-05-27 00:14:21 来源:中国专利 TAG:

技术特征:
1.一种基于多残基间距离图约束的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)输入目标蛋白质的序列信息;2)根据输入目标蛋白质的序列信息从robetta服务器获取片段库文件,其中包括3片段库文件和9片段库文件;3)根据输入目标蛋白质的序列信息从trrosetta服务器、raptorx服务器、lomets服务器获得三个残基间距离文件distancefile,将三个distancefile文件里面的数据进行处理后生成三个distancemap文件,并分别命名为dis_trrosetta、dis_raptorx、dis_loments;4)根据dis_trrosetta、dis_raptorx、dis_loments三个distancemap文件构建评分函数dscore,公式如下:d
*
=log(ε |i-j|)
ꢀꢀꢀꢀ
(1-2)其中,l表示蛋白质序列长度,i和j表示构象c
n
的第i个残基和第j个残基,表示trrosetta服务器、raptorx服务器、loments服务器预测距离的置信度,d
ij
表示构象c
n
的第i个残基和第j个残基的实际距离,表示构象c
n
的第i个残基和第j个残基在trrosetta服务器、raptorx服务器、loments服务器的预测距离,d
*
表示归一化标度,ε表示无穷小量,以避免d
*
为零;5)设置参数:种群大小np,第一代种群迭代次数g
first
,第二代种群迭代次数g
second
,聚类算法迭代次数为n,聚类簇数为k,温度因子β,置第一代种群迭代代数g
first
=0,置第二代种群迭代代数g
second
=0,置聚类算法迭代代数n=0,置步骤10)中迭代代数m=0;6)种群初始化:随机片段组装生成包含np个初始构象c
i
的初始种群,i={1,2,...,np};7)随机选择初始种群中的一个构象作为目标构象对每个执行以下操作生成测试构象更新种群,过程如下:7.1)从种群中随机选出三个互不相同的构象c
r1
、c
r2
、c
r3
,且c
r1
、c
r2
、c
r3
与互不相同,从c
r1
、c
r2
、c
r3
中随机选择一个位置不同的9片段,分别替换对应位置的片段生成变异构象7.2)对进行片段组装生成测试构象7.3)用rosetta score3能量函数分别计算和的能量记为和
7.4)若则替换否则按照概率以蒙特卡洛准则接收构象8)g
first
=g
first
1,迭代运行步骤7),至g
first
>g
first
为止,生成一代种群;9)对一代种群进行聚类,选取代表构象构建二代种群,过程如下:9.1)在一代种群中随机选择k个构象作为初始的k个质心构象,{μ1,μ2,...,μ
k
};9.2)遍历一代种群中的构象c
i
,i={1,2,...,np},引入一种蛋白质结构比较算法tm-align,其返回值是衡量结构相似性的tm-score,通过使用tm-align比较构象c
i
和k个质心构象,将构象c
i
放入与k个质心构象中相似度最高的质心构象所在的那个簇,tm-score计算公式如下:公式如下:其中,l表示蛋白质序列长度,表示质心构象μ
k
和一代种群中构象c
i
之间的第i对残基对之间的距离,d0是归一化距离的一个距离标度;9.3)对k个簇中的每个构象计算其dscore,将每个簇中dscore最低的构象更新为该簇的质心;9.4)n=n 1,迭代运行步骤9.2)~9.3)至质心位置不变或n>n为止;9.5)使用tm-align对k个簇中的每个构象与该簇质心构象进行比较,并将每个簇中的构象按与质心构象相似度进行排序,将相似度高的构象转移到二代种群中直至二代种群的种群规模达到half_np,half_np=np
×
0.5;10)遍历二代种群中每一个构象作为目标构象对每个执行以下操作生成测试构象过程如下:10.1)利用rosetta score3能量函数计算二代种群中每个构象的能量,选择一个能量最低的构象c
best
,再从种群中随机选择两个互不相同的构象c
r1
、c
r2
,且c
best
、c
r1
、c
r2
与互不相同,分别从c
best
、c
r1
、c
r2
中随机选择一个位置不同的9片段,分别替换对应位置的片段生成变异构象10.2)对进行片段组装生成测试构象10.3)根据公式(3)计算和二代种群内每个构象的相似度并按相似度进行从高到低排序:其中,l表示输入序列长度,i和j表示和二代种群中构象c
k
的第i个残基和第j个残
基,和表示和二代种群中构象c
k
的第i个残基和第j个残基之间的实际距离;10.4)取二代种群中的一个构象作为目标构象计算基于预测的残基间距离的评分和q={1,2,...,mini_np},mini_np=np
×
0.2;10.5)如果则替换否则按照概率以蒙特卡洛准则接收构象10.6)m=m 1,迭代运行步骤10.4)~10.5),至接收构象或m>mini_np为止;11)g
second
=g
second
1,迭代运行步骤9)~10),至g
second
>g
second
为止;12)输出score3能量与dscore之和最低的构象为最终结果。

技术总结
一种基于多残基间距离图约束的蛋白质结构预测方法,首先由trRosetta、RaptorX、LOMETS三个蛋白质残基间距离预测服务器获得三个残基间距离文件以构建三张残基间距离图从来构建基于残基间距离的评分函数;其次循环Rosetta第一、第二阶段以生成初始种群,然后在种群中选择目标构象并对其进行交叉变异以生成测试构象,并通过Rosetta score3概率接收测试构象,以增加种群中构象多样性;然后通过聚类找出符合标准的构象以缩小种群规模,增加算法效率;最后根据三个残基间距离图构建的评分函数来更新种群中的构象,得到最接近天然构象的最优构象。本发明预测效率和预测精度较高。本发明预测效率和预测精度较高。本发明预测效率和预测精度较高。


技术研发人员:张贵军 金思融 侯铭桦 徐旭瑶 葛锋其 周晓根
受保护的技术使用者:浙江工业大学
技术研发日:2022.02.28
技术公布日:2022/5/25
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献