一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于上下文感知计算的RNA溶剂可及性预测方法与流程

2022-02-20 13:17:22 来源:中国专利 TAG:

技术特征:
1.一种基于上下文感知计算的rna溶剂可及性预测方法,其特征在于,包括:s1.收集pdb数据库中所有已注释三级结构信息的rna序列组成训练集合s,并使用pops工具生成rna序列对应的溶剂可及性标签y;s2.获取训练集合s中碱基个数为l
x
的rna序列信息,并将获取的rna序列信息记作s
x
;s3.使用infernal工具搜索s
x
的核苷酸数据库并生成对应的多序列联配信息msa;s4.对多序列联配信息msa进行处理,生成msa对应的特征矩阵fmsa;s5.根据独热编码原理将碱基编码生成s
x
对应的独热编码矩阵ohe;s6.使用linearpartition-v工具生成s
x
对应的二级结构信息rss;s7.构建上下文感知计算神经网络框架mvcadnn,并使用构建的上下文感知计算神经网络框架mvcadnn训练rna溶剂可及性预测模型,得到训练后的rna溶剂可及性预测模型;s8.将待预测rna序列通过步骤s3-步骤s6处理后,生成rna序列对应的特征信息,并生成的特征信息输入到训练后的rna溶剂可及性预测模型中,得到rna溶剂可及性的预测信息。2.根据权利要求1所述的一种基于上下文感知计算的rna溶剂可及性预测方法,其特征在于,所述步骤s3中多序列联配信息msa,表示为:其中,表示msa中的第n条序列联配信息;n表示msa中的序列联配信息总数目。3.根据权利要求2所述的一种基于上下文感知计算的rna溶剂可及性预测方法,其特征在于,所述步骤s4中特征矩阵fmsa,表示为:在于,所述步骤s4中特征矩阵fmsa,表示为:在于,所述步骤s4中特征矩阵fmsa,表示为:在于,所述步骤s4中特征矩阵fmsa,表示为:在于,所述步骤s4中特征矩阵fmsa,表示为:其中,表示中的第l
x
个元素;表示中的第l
y
个元素;r
r
表示元素集合r中的第r个元素;表示第x位置上r碱基的概率;表示第y位置上r碱基的概率;σ表示符号函数;表示第x位置和第y位置的碱基特征;表示第x位置和第y位置上的碱基的信息熵值;l
x
表示第x位置的碱基。
4.根据权利要求3所述的一种基于上下文感知计算的rna溶剂可及性预测方法,其特征在于,所述步骤s5中独热编码矩阵ohe,表示为:其中,表示ohe中的第l个元素的独热编码信息。5.根据权利要求4所述的一种基于上下文感知计算的rna溶剂可及性预测方法,其特征在于,所述步骤s5中的碱基编码包括ohe
a
=[1,0,0,0]、ohe
u
=[0,1,0,0]、ohe
g
=[0,0,1,0]、ohe
c
=[0,0,0,1];其中,a表示腺嘌呤、u表示尿嘧啶、g鸟嘌呤、c胞嘧啶。6.根据权利要求1所述的一种基于上下文感知计算的rna溶剂可及性预测方法,其特征在于,所述步骤s7中的上下文感知计算神经网络框架mvcadnn包括5个管道,第一管道、第二管道和第三管道分别用于挖掘隐含fmsa、ohe与rss中的鉴别信息;第四管道用于挖掘隐含在fmsa、ohe与rss的串行组合特征中的鉴别信息;第五管道用于挖掘由第一管道

、第二管道、第三管道和第四管道的输出经串行组合后的特征中的鉴别信息。7.根据权利要求6所述的一种基于上下文感知计算的rna溶剂可及性预测方法,其特征在于,所述第一管道、第二管道和第三管道均由两个两层的双向长短时记忆循环神经网络、三个全连接层、两个注意力机制模块组成。8.根据权利要求6所述的一种基于上下文感知计算的rna溶剂可及性预测方法,其特征在于,所述第四管道由一个1d膨胀卷积层,三个残差块,二个全连接层组成。9.根据权利要求6所述的一种基于上下文感知计算的rna溶剂可及性预测方法,其特征在于,所述第五管道由三个全连接层和三个注意力机制模块组成。

技术总结
本发明公开了一种基于上下文感知计算的RNA溶剂可及性预测方法,包括:S1.收集PDB数据库中所有已注释三级结构信息的RNA序列组成训练集合S;S2.获取训练集合S中碱基个数为L


技术研发人员:胡俊 樊学强 唐玉璇 贾宁欣 张贵军
受保护的技术使用者:浙江工业大学
技术研发日:2021.09.29
技术公布日:2022/1/14
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献