一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于三维原子密度图优化分子结构的处理方法和装置与流程

2023-03-15 10:23:00 来源:中国专利 TAG:

技术特征:
=h4=h0,w1、w2、w3和w4分别为对应特征图的宽度、w1=w2=w3=w4=w0,d1、d2、d3和d4分别为对应特征图的通道数量;所述第一cα原子密度图包括多个所述第一cα原子;各个所述第一cα原子与所述第二特征图的所述第一cα原子目标一一对应;各个所述第一cα原子对应一组第一cα原子特征数据,所述第一cα原子特征数据包括所述第二特征图上对应的所述第一cα原子目标的所述第一cα原子坐标、所述第一3d原子密度图上与对应的所述第一cα原子坐标匹配的第一密度图特征、所述第一特征图上与对应的所述第一cα原子坐标匹配的所述第一残基目标的一个或多个所述第一肽键方向和多个所述第一残基类型概率;所述第一主干原子密度图包括多个所述第一主干原子密度区域;各个所述第一主干原子密度区域包括一个或多个第二cα原子、或一个或多个第一n原子、或一个或多个第一c原子;各个所述第二cα原子与所述第二特征图的所述第一cα原子目标一一对应,各个所述第一n原子与所述第三特征图的所述第一n原子目标一一对应,各个所述第一c原子与所述第四特征图的所述第一c原子目标一一对应;各个所述第二cα原子、所述第一n原子和所述第一c原子都对应一组第一主干原子特征数据;所述第一主干原子特征数据包括第一主干原子类型、第一主干原子坐标和第一主干原子密度图特征;所述第一主干原子类型包括cα原子类型、n原子类型和c原子类型;第一主干原子坐标为所述第二特征图上对应的所述第一cα原子目标的所述第一cα原子坐标、或所述第三特征图上对应的所述第一n原子目标的所述第一n原子坐标、或所述第四特征图上对应的所述第一c原子目标的所述第一c原子坐标;所述第一主干原子密度图特征为所述第一3d原子密度图上与所述第一主干原子坐标匹配的密度图特征。5.根据权利要求2所述的基于三维原子密度图优化分子结构的处理方法,其特征在于,所述根据所述第一cα原子密度图和所述第一蛋白质序列进行残基标注片段识别处理生成多个第一标注片段,具体包括:根据所述第一cα原子密度图的各个所述第一cα原子的一个或多个所述第一肽键方向进行相邻cα原子链接从而得到多个第一cα原子链;并将每个所述第一cα原子链视为一个对应的第一残基片段;所述第一cα原子链由多个所述第一cα原子链接而成,所述第一cα原子链中每两个链接的所述第一cα原子各有一个所述第一肽键方向彼此重合并由该对重合的所述第一肽键方向和两个所述第一cα原子各自的所述第一cα原子坐标构成二者的链接关系;对所述第一cα原子密度图上所述第一cα原子的所述第一残基类型概率的数量进行统计生成对应的第一残基类型总数m;并对所述第一蛋白质序列的残基类型序列长度进行统计生成对应的第一序列长度l;并对各个所述第一残基片段的所述第一cα原子的数量进行统计生成对应的第一片段长度l
x
;根据所述第一残基类型总数m、所述第一序列长度l和各个所述第一残基片段的所述第一片段长度l
x
对各个所述第一残基片段在所述第一蛋白质序列中的残基片段评分和残基片段起始位置进行预测生成对应的第一残基片段评分和第一残基片段起始位置;将所述第一残基片段评分超过预设评分阈值的所述第一残基片段记为对应的第一预选残基片段;并根据所述第一蛋白质序列和各个所述第一预选残基片段对应的所述第一片段长度l
x
和所述第一残基片段起始位置对各个所述第一预选残基片段进行片段残基类型
矫正处理生成对应的第一片段残基类型序列;并对各个所述第一预选残基片段的片段平均概率进行统计生对应的第一片段平均概率;所述第一片段残基类型序列包括多个第二残基类型;将所述第一片段长度l
x
超过预设长度阈值且所述第一片段平均概率超过预设概率阈值的所述第一预选残基片段作为对应的所述第一标注片段;并对得到的多个所述第一标注片段,按对应的所述第一残基片段起始位置的先后顺序排序并将排序索引作为对应的所述第一片段序号;并将各个所述第一标注片段对应的所述第一片段残基类型序列作为对应的所述第一片段类型序列;并将各个所述第一标注片段的第一个所述第一cα原子的所述第一cα原子坐标作为对应的所述第一片段起始坐标;并由各个所述第一标注片段对应的所述第一片段序号、所述第一片段类型序列和所述第一片段起始坐标组成对应的所述第一片段特征数据。6.根据权利要求5所述的基于三维原子密度图优化分子结构的处理方法,其特征在于,所述根据所述第一残基类型总数m、所述第一序列长度l和各个所述第一残基片段的所述第一片段长度l
x
对各个所述第一残基片段在所述第一蛋白质序列中的残基片段评分和残基片段起始位置进行预测生成对应的第一残基片段评分和第一残基片段起始位置,具体包括:根据所述第一残基类型总数m和所述第一序列长度l,对所述第一蛋白质序列进行独热矩阵编码处理得到对应的形状为m
×
l的第一矩阵向量f
*
;所述第一矩阵向量f
*
包括m*l个向量数据元,所述第一矩阵向量f
*
的每行对应一类残基类型,所述第一矩阵向量f
*
的列按所述第一蛋白质序列的残基类型顺序进行排序;所述第一矩阵向量f
*
每列的m个向量数据元中,与当前列对应的残基类型匹配的向量数据元的编码被设为1、其余m-1个向量数据元的编码被设为0;根据所述第一残基类型总数m和所述第一残基片段的所述第一片段长度l
x
,对所述第一残基片段进行二维矩阵转换处理得到对应的形状为m
×
l
x
的第二矩阵向量g
*
;所述第二矩阵向量g
*
包括m*l
x
个向量数据元,所述第二矩阵向量g
*
每行对应一类残基类型,所述第二矩阵向量g
*
的列按所述第一残基片段的所述第一cα原子的顺序进行排序;所述第二矩阵向量g
*
每列的m个向量数据元为当前列对应的所述第一cα原子的m个所述第一残基类型概率;设滑窗的滑动步长为每次1列、设滑窗的滑窗宽度为l
x
列;并根据设定滑窗的滑动步长和滑窗宽度,对所述第一矩阵向量f
*
从第一列开始进行滑窗滑动处理得到(l-l
x
1)个形状为m
×
l
x
的第一滑窗矩阵向量;并对各个所述第一滑窗矩阵向量进行一维向量转换处理生成对应的长度为(m*l
x
)的第一一维向量;并由得到的(l-l
x
1)个所述第一一维向量组成对应的形状为(l-l
x
1)
×
(m*l
x
)的第三矩阵向量f;对所述第二矩阵向量g
*
进行一维向量转换处理生成对应的长度为(m*l
x
)的第二一维向量;并对所述第二一维向量进行二维矩阵升维处理得到对应的形状为(m*l
x
)
×
1的第四矩阵向量g;对所述第三矩阵向量f与所述第四矩阵向量g进行向量叉乘运算生成对应的形状为(l-l
x
1)
×
1的第五矩阵向量s,s=f
×
g;并对所述第五矩阵向量s进行一维向量降维处理生成对应的长度为(l-l
x
1)的第三一维向量;并从所述第三一维向量的(l-l
x
1)个向量数据元中选取最大值作为对应的所述第一残基片段评分;并将所述第一残基片段评分在所述第三
一维向量中的排序索引作为对应的所述第一残基片段起始位置。7.根据权利要求5所述的基于三维原子密度图优化分子结构的处理方法,其特征在于,所述根据所述第一蛋白质序列和各个所述第一预选残基片段对应的所述第一片段长度l
x
和所述第一残基片段起始位置对各个所述第一预选残基片段进行片段残基类型矫正处理生成对应的第一片段残基类型序列,具体包括:以所述第一残基片段起始位置为提取起始位置、以所述第一片段长度l
x
为提取长度,从所述第一蛋白质序列中提取一段子序列作为对应的第一子序列;所述第一子序列包括l
x
个残基类型;对所述第一预选残基片段的l
x
个所述第一cα原子进行逐一遍历;并在遍历时,将当前遍历的所述第一cα原子在所述第一预选残基片段的排序索引作为对应的第一索引;并将当前遍历的所述第一cα原子对应的m个所述第一残基类型概率中的最大概率对应的残基类型作为对应的所述第二残基类型;并将所述第一子序列中排序索引与所述第一索引匹配的残基类型作为对应的第一目标类型;并对所述第二残基类型与所述第一目标类型是否匹配进行识别;若匹配,则转至下一个所述第一cα原子继续遍历直到最后一个所述第一cα原子遍历结束为止;若不匹配,则使用所述第一目标类型对所述第二残基类型进行重置,并在重置结束时转至下一个所述第一cα原子继续遍历直到最后一个所述第一cα原子遍历结束为止;并在遍历结束时,由得到l
x
个所述第二残基类型排序组成对应的所述第一片段残基类型序列。8.根据权利要求5所述的基于三维原子密度图优化分子结构的处理方法,其特征在于,所述对各个所述第一预选残基片段的片段平均概率进行统计生对应的第一片段平均概率,具体包括:对所述第一预选残基片段的l
x
个所述第一cα原子进行逐一遍历;并在遍历时,将当前遍历的所述第一cα原子对应的m个所述第一残基类型概率中的最大概率作为对应的第一最大概率;并在遍历结束时,对得到l
x
个所述第一最大概率进行均值计算生成对应的所述第一片段平均概率。9.根据权利要求2所述的基于三维原子密度图优化分子结构的处理方法,其特征在于,所述根据所有所述第一标注片段和所述第一主干原子密度图对所述第一3d初始结构进行三维分子结构优化处理生成对应的第一优化结构,具体包括:以所有所述第一标注片段为目标对所述第一3d初始结构进行局部优化处理生成新的所述第一3d初始结构;以所述第一主干原子密度图为目标按预设的全局优化模式对所述第一3d初始结构进行全局优化处理生成新的所述第一3d初始结构;所述全局优化模式包括第一模式和第二模式;将完成了局部结构优化和全局结构优化的所述第一3d初始结构作为对应的所述第一优化结构输出。10.根据权利要求9所述的基于三维原子密度图优化分子结构的处理方法,其特征在于,所述以所有所述第一标注片段为目标对所述第一3d初始结构进行局部优化处理生成新的所述第一3d初始结构,具体包括:在所述第一3d初始结构的三维空间中对所有所述第一标注片段的所述第一cα原子进
行标记作为对应的第一目标点;并将所述第一3d初始结构上与各个所述第一目标点对应的cα原子记为对应的第一初始点;并基于分子动力学模拟技术以所有所述第一目标点为优化目标对所述第一3d初始结构进行迭代优化,并在迭代过程中对每次迭代优化获得的第一过程优化结构上各个所述第一初始点与对应的所述第一目标点的点间距进行计算生成对应的第一点间距,并在所有所述第一点间距都低于预设的点间距阈值时停止迭代优化并将最新的所述第一过程优化结构作为新的所述第一3d初始结构输出。11.根据权利要求9所述的基于三维原子密度图优化分子结构的处理方法,其特征在于,所述以所述第一主干原子密度图为目标按预设的全局优化模式对所述第一3d初始结构进行全局优化处理生成新的所述第一3d初始结构,具体包括:对所述全局优化模式进行识别;当所述全局优化模式为第一模式时,基于选定的第一力场和第一力场势能函数,对所述第一主干原子密度图进行势能计算生成对应的第一势能;并根据所述第一势能和所述第一力场势能函数构建对应的第一力场目标势能函数;并将第一迭代计数器初始化为0;并基于分子模拟技术以使所述第一力场目标势能函数达到最小值为目标对所述第一3d初始结构按预设的迭代次数阈值a进行a次迭代优化,并在每次迭代优化时对所述第一迭代计数器加1,并从所述第一迭代计数器的计数值等于预设的起始迭代次数阈值b时起每隔预设的迭代次数间期x就对最新获得的第二过程优化结构做一次保存从而在a次迭代优化结束时获得第一数量y的所述第二过程优化结构,y=int[(a-b)/x] 1,int[]为向下取整函数;并将所述第一数量y的所述第二过程优化结构中结构势能低于预设势能阈值的所述第二过程优化结构记为对应的第三过程优化结构;并将对各个所述第三过程优化结构进行三维电镜密度图转换处理生成对应的第一电镜密度图;并对各个所述第一电镜密度图与所述第一主干原子密度图的相关度进行计算生成对应的第一相关度,并将其中最大的所述第一相关度对应的所述第三过程优化结构作为新的所述第一3d初始结构输出;当所述全局优化模式为第二模式时,将第二迭代计数器初始化为0;并基于分子模拟技术在选定力场和选定势能函数的模拟条件下,以使过程优化结构对应的三维电镜密度图与所述第一电镜密度图的相关度达到最大值为目标对所述第一3d初始结构进行迭代优化,并在每次迭代优化时对所述第二迭代计数器加1,并从所述第二迭代计数器的计数值等于预设的起始迭代次数阈值e时起每隔预设的迭代次数间期z就对最新获得的第四过程优化结构进行一次三维电镜密度图转换处理生成对应的第二电镜密度图,并对当次获得的所述第二电镜密度图与所述第一主干原子密度图的相关度进行计算生成对应的第二相关度,并在所述第二相关度超过预设的相关度阈值时停止迭代优化并将最新的所述第四过程优化结构作为新的所述第一3d初始结构输出。12.一种用于执行权利要求1-11任一项所述的基于三维原子密度图优化分子结构的处理方法的装置,其特征在于,所述装置包括:获取模块、图像识别模块、片段标注模块和结构优化模块;所述获取模块用于获取第一3d原子密度图和对应的第一蛋白质序列、第一3d初始结构;所述图像识别模块用于基于预设的3d图像识别模型对所述第一3d原子密度图进行目标识别处理生成对应的第一cα原子密度图和第一主干原子密度图;
所述片段标注模块用于根据所述第一cα原子密度图和所述第一蛋白质序列进行残基标注片段识别处理生成多个第一标注片段;所述结构优化模块用于根据所有所述第一标注片段和所述第一主干原子密度图对所述第一3d初始结构进行三维分子结构优化处理生成对应的第一优化结构。13.一种电子设备,其特征在于,包括:存储器、处理器和收发器;所述处理器用于与所述存储器耦合,读取并执行所述存储器中的指令,以实现权利要求1-11任一项所述的方法步骤;所述收发器与所述处理器耦合,由所述处理器控制所述收发器进行消息收发。14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行权利要求1-11任一项所述的方法的指令。

技术总结
本发明实施例涉及一种基于三维原子密度图优化分子结构的处理方法和装置,所述方法包括:获取第一3D原子密度图和对应的第一蛋白质序列、第一3D初始结构;基于预设的3D图像识别模型对第一3D原子密度图进行目标识别处理生成对应的第一Cα原子密度图和第一主干原子密度图;根据第一Cα原子密度图和第一蛋白质序列进行残基标注片段识别处理生成多个第一标注片段;根据所有第一标注片段和第一主干原子密度图对第一3D初始结构进行三维分子结构优化处理生成对应的第一优化结构。过本发明,以先验的三维初始结构为优化对象、以来自于三维密度图的Cα原子密度图和主干原子密度图为目标进行全局、局部优化,可以提高三维结构的优化效率。化效率。化效率。


技术研发人员:陈伟杰 王宇航 王新颜 张林峰 孙伟杰
受保护的技术使用者:北京深势科技有限公司
技术研发日:2022.11.07
技术公布日:2023/2/3
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献