一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种预测微生物-药物关联作用的方法及系统

2022-12-13 21:34:38 来源:中国专利 TAG:


1.本发明涉及生物信息学技术领域,更具体的,涉及一种预测微生物-药物关联作用的方法。


背景技术:

2.近年来,医学领域的研究重点是探索微生物群落失衡与药物疗效和毒性之间的关系,然而,对微生物群落与药物在人体内相互作用的复杂机制仍缺乏全面的了解。目前,新药开发面临两大挑战。一方面,抗生素的发现种类很少,大多数工作集中在优化或组合已知化合物,在实验室条件下很难培养目标菌种,大多数药物在实验过程中失败。另一方面,耐药细菌的数量也在以惊人的速度增长。越来越多的研究表明,微生物与药物有着密切的相互作用,微生物与药物之间的某些联系已被培养实验所证实,但尚不足以阐明人类微生物与药物之间复杂的相互作用机制。因此,迫切需要开发一种有效的方法来系统地探索微生物与药物之间可能的联系。
3.目前存在两类计算方法用于预测微生物与药物的关系。
4.第一类方法主要关注相似性度量,例如使用katz度量的hmdakatz方法,但此类度量过于简单,无法充分反映相似性,会导致不准确的关联识别。
5.第二类方法使用图表式学习方法,该方法在图数据表示中使用丰富的语义信息,与以前基于相似度量的方法相比,具有更好的预测能力。当前有两种常见的图表征学习方法:元路径和图卷积网络。
6.元路径算法主要利用微生物药物关联的边缘信息进行预测。元路径算法将metapath2vec与神经网络建议相结合,用于学习微生物和药物的低维嵌入表示。元路径算法确实有助于提高模型的预测能力,但它过于依赖边缘信息,在引入新药或新微生物时,考虑到没有现有的边缘信息,自然会导致预测失败。
7.与元路径相比,gcn方法不仅能捕获边缘信息,还能捕获节点信息。因此,在目前的方法中,使用gcn方法预测微生物药物相关性引起了广泛的兴趣。long等人首先将gcn编码器应用于微生物药物关联的方法gcnmda,并将条件随机场引入gcn隐藏层。现有还有一种节点级注意gcn的方法egatmda来学习节点(即微生物和药物)的嵌入,它可以有效地保留图的目标邻居,并且只保留相关信息。然而,现有方法未能构建包含生物信息的节点特征。
8.综上所述,现有的预测微生物-药物关联作用的方法存在无法构建生物和药物的丰富可解释的节点特征的问题,因此,如何发明一种可以构建生物和药物的可解释的节点特征的预测微生物-药物关联作用的方法,是本领域亟需解决的技术问题。


技术实现要素:

9.本发明为了解决现有技术无法构建生物和药物的可解释的节点特征的问题,提供了一种预测微生物-药物关联作用的方法,其具有能够考虑到现有微生物-药物关联数据集带来的稀疏性问题的特点。
10.为实现上述本发明目的,采用的技术方案如下:
11.一种预测微生物-药物关联作用的方法,包括以下步骤:
12.s1.通过微生物-药物关联数据库构建微生物-药物的关联网络,将关联网络称为net1;
13.s2.通过微生物-药物关联数据库中的微生物数据库检索出微生物-微生物的相关的相互作用,通过微生物-药物关联数据库中的药物数据库检索出药物-药物的相关的相互作用;根据微生物-微生物的相关的相互作用和药物-药物的相关的相互作用构建相互作用网络,将相互作用网络称为net2;
14.s3.通过药物数据库构建药物的拓扑属性网络,通过微生物数据库构建微生物基因序列;根据药物数据库中药物的综合相似性属性和药物网络药物网络拓扑属性、微生物数据库中微生物的功能相似性属性和基因组序列属性,构建微生物-药物的多模态属性图;
15.s4.根据net1、net2、微生物-药物的多模态属性图,建立引入正则化的图神经网络模型;
16.s5.将net1、net2结合微生物-药物的多模态属性图输入图神经网络模型得到嵌入表示z1和z2;将嵌入表示z1和z2输入图神经网络中进行训练,得到训练好图神经网络;
17.s6.获取待预测数据集,通过训练好图神经网络预测待预测数据集中微生物-药物的关联作用。
18.本发明通过过微生物-药物关联数据库构建微生物-药物的关联网络,并进一步得到互作用网络net1和net2;建立引入正则化的图神经网络模型,将net1、net2结合微生物-药物的多模态属性图输入图神经网络模型得到嵌入表示z1和z2,并将嵌入表示z1和z2输入图神经网络中进行训练,得到训练好图神经网络;构建了生物和药物的可解释的节点特征,并考虑了现有微生物-药物关联数据集带来的稀疏性问题。
19.优选的,所述的步骤s3中,通过药物数据库构建药物的拓扑属性网络,通过微生物数据库构建微生物基因序列;根据药物数据库中药物的综合相似性属性和药物网络药物网络拓扑属性、微生物数据库中微生物的功能相似性属性和基因组序列属性,构建微生物-药物的多模态属性图的具体步骤为:
20.s301.根据药物数据库中的药物相似性属性构建药物的相似性特征矩阵,并通过药物数据库构建药物的拓扑属性网络,从而得到药物的第二属性特征矩阵;
21.s302.根据微生物数据库中微生物的功能相似性属性构建微生物的相似性特征矩阵,并通过微生物数据库构建微生物基因序列,从而得到微生物的第二属性特征矩阵;
22.s303.根据药物的相似性特征矩阵和微生物的相似性特征矩阵,构建微生物-药物相似性特征网络;
23.s304.根据药物的第二属性特征矩阵和微生物的第二属性特征矩阵,构建微生物-药物第二属性特征网络;
24.s305.将微生物-药物相似性特征网络和微生物-药物第二属性特征网络结合得到微生物-药物的多模态属性图。
25.进一步的,所述的步骤s301中,根据药物数据库中的药物相似性属性构建药物的相似性特征矩阵,并通过药物数据库构建药物的拓扑属性网络,从而得到药物的第二属性特征矩阵,具体步骤为:
26.a1.使用simcomp2工具,计算药物数据库中的药物相似性属性,得到药物的分子结构相似度矩阵ds
struct
(di,dj);
27.a2.用矩阵dip表示net2中药物-药物相互作用谱,得到标准化内核带宽:
[0028][0029]
其中,μ表示标准化内核带宽,μ

为原始带宽,设置为1,dip(di)表示药物di与其他药物的相互作用,nd表示所述net1中微生物的数量;
[0030]
a3.将药物的相似性特征矩阵表示为sd(di,dj):
[0031][0032]
a4.通过带重启的随机游走方法构建药物数据库中药物网络拓扑属性,在药物网络上进行随机漂移和重启,直到药物网络收敛,完成药物网络构建,从而得到每个药物的概率分布向量,构建药物的第二属性特征矩阵fd∈r
nd
×
nd

[0033]
更进一步的,所述的步骤a4中,随机漂移和重启的公式为:
[0034][0035]
其中,表示药物网络的第i个节点在时间t 1移动到其他节点的概率,θ是重启概率,t是转移概率矩阵,p
i(0)
∈rn×1表示药物网络的第i个节点的起始概率向量,p
i(t)
∈rn×1表示药物网络的第i个节点在时间t移动到其他节点的概率。
[0036]
更进一步的,所述的步骤s302中,根据微生物数据库中微生物的功能相似性属性构建微生物的相似性特征矩阵,并通过微生物数据库构建微生物基因序列,从而得到微生物的第二属性特征矩阵的具体步骤为:
[0037]
b1.使用kamneva工具计算生物数据库中的微生物的功能相似性属性,得到微生物的相似性特征矩阵sm∈r
nm
×
nm
,其中,nm表示net1中微生物的数量;将微生物mi和微生物mj之间的相似性表示为sm(mi,mj);
[0038]
b2.对微生物数据库中的微生物数据的原始基因序列进行编码,得到微生物基因序列;
[0039]
b3.将所有编码后的微生物基因序列用零填充,使所有填充后的微生物基因序列长度相同;
[0040]
b4.使用主成分析法对所有填充后的微生物基因序列进行分析,获得k维矩阵,将微生物的第二属性特征矩阵由k维矩阵表示为fm∈r
nm
×k。
[0041]
更进一步的,所述的步骤s303中,根据药物的相似性特征矩阵和微生物的相似性特征矩阵,构建微生物-药物相似性特征网络,具体步骤为:
[0042]
c1.根据药物的相似性特征矩阵和微生物的相似性特征矩阵,构建微生物-药物相似性特征网络x
simility

[0043][0044]
c2.根据药物的第二属性特征矩阵和微生物的第二属性特征矩阵构建微生物-药物第二属性特征网络x
secondary

[0045][0046]
c3.将微生物-药物相似性特征网络和微生物-药物第二属性特征网络结合得到微生物-药物的多模态属性图x:
[0047]
x=[x
simility
,x
secondary
]。
[0048]
更进一步的,所述的步骤s4中,根据net1、net2、微生物-药物的多模态属性图,建立引入正则化的图神经网络模型,具体步骤为:
[0049]
s401.根据微生物-药物的多模态属性图建立微生物-药物的特征矩阵,构建微生物-药物的异构矩阵,在异构矩阵里,vi表示任意一个节点的微生物或者药物,异构矩阵表示为:
[0050][0051]
其中,y为微生物-药物的特征矩阵,表示节点vi的内容特征向量;
[0052]
s402.设置可学习矩阵w∈rm×
f,并使用随机数为可学习矩阵的元素赋初值,其中,f为节点嵌入表示的维度,由超参数设定,n=nd nm为节点数,m=2
×
(nd nm)为节点的特征维度,根据和w生成经过特征变换的向量
[0053][0054]
s403.设置缩放常数s∈r,其表示传播的隐藏特征的范数,并由正则化的图神经网络模型的gncn网络生成归一化特征变换向量
[0055][0056]
s404.求得l2正则化的公式g():
[0057][0058]
s405.使用gncn编码器对微生物-药物的关联网络和微生物-药物的多模态属性图进行编码:
[0059][0060]
其中,a∈r
nd
×
nm
为步骤s1中所述关联网络的邻接矩阵,若关联网络中节点i和j之间存在已知关联,则a中元素aij设置为1,否则为0;其中in为n阶单位矩阵,为的度矩阵。
[0061]
更进一步的,所述的步骤s5中,将net1、net2结合微生物-药物的多模态属性图输入图神经网络模型得到嵌入表示z1和z2;将嵌入表示z1和z2输入图神经网络中进行训练,得到训练好图神经网络的具体步骤为:
[0062]
s501.通过gncn网络传播归一化向量以生成节点嵌入向量
[0063][0064]
其中,为矩阵中i的单位向量,为矩阵中j的单位向量,degi为节点i的度数;degj为节点j的度数;
[0065]
s502.根据节点嵌入向量生成节点嵌入矩阵,生成gncn编码器的隐变量z∈rn
×
f,得到net1对应的z1和net2对应的z2:
[0066]
zi=gncn(x,a,s);
[0067]
s503.定义一个损失函数,所述的损失函数为多模态属性图和训练中图神经网络得到的重构图之间的二进制交叉熵:
[0068][0069]
其中,l为损失函数,n为所有节点的总数,y代表邻接矩阵a中某个元素的值,取值为0或1,代表重构的邻接矩阵中相应元素的值,取值在0到1之间;
[0070]
s504.将z1、z2输入图神经网络模型的dnn分类器中,将训练次数epoch设置为k2,训练的过程采用随机梯度下降,当损失函数收敛时停止训练,得到训练好的图神经网络。
[0071]
更进一步的,在所述的步骤s5中,训练好图神经网络模型后,还进行了图神经网络模型的验证,验证的具体步骤为:
[0072]
d1.引入k-fold交叉验证框架,在k-fold交叉验证框架下,将现有的微生物-药物关联数据库上所有已知微生物-药物关联数据随机分为k1个群,将k1个群中每一个具有相同大小批次的随机抽样未知关联对的子集选为测试集,将剩余的已知关联对选为训练集;
[0073]
d2.将测试集输入训练好的图神经网络模型中,得到分类结果;
[0074]
d3.若分类结果为正类则预测该微生物和该药物存在关联,若分类结果为负类则预测该微生物和药物不存在关联;
[0075]
d4.根据分类结果得到训练好的图神经网络模型的auc值;根据auc值,验证图神经网络模型的准确性。
[0076]
更进一步的,步骤d4中,据分类结果得到训练好的图神经网络模型的auc值,具体步骤为;
[0077]
e1.将训练集输入模型,得到当前模型对训练集的重构图,取当前模型对训练集的重构图中各节点之间边的得分,记为关联概率,关联概率取值0-1之间;
[0078]
e2.关联概率作为分类阈值,当其他关联概率大于该分类阈值时,视为预测成正样本,当其他关联概率小于该分类阈值时,视为预测成负样本;
[0079]
e3.根据训练集中微生物-药物的关联关系,得到训练集中边的标签真值,标签真值取值0或1,其中,0表示不存在边即不存在关联关系,即实际是负样本,1表示存在边即存在关联关系,即实际是正样本;
[0080]
e4.统计各分类阈值下的真阳性率和伪阳性率:
[0081]
[0082][0083]
其中,tprate为真阳性率,fprate为伪阳性率,tp为真阳率,表示实际是负样本预测成正样本的样本数,fn为假阴率,表示实际是正样本预测成负样本的样本数,fp为假阳率,表示实际是负样本预测成正样本的样本数,tn为真阴率,表示实际是负样本预测成负样本的样本数;
[0084]
e5.以fprate为横轴,tprate为纵轴绘制roc曲线,使用微元法计算roc曲线面积,即auc值。
[0085]
本发明的有益效果如下:
[0086]
本发明通过过微生物-药物关联数据库构建微生物-药物的关联网络,并进一步得到互作用网络net1和net2;建立引入正则化的图神经网络模型,将net1、net2结合微生物-药物的多模态属性图输入图神经网络模型得到嵌入表示z1和z2,并将嵌入表示z1和z2输入图神经网络中进行训练,得到训练好图神经网络;构建了生物和药物的可解释的节点特征,并考虑了现有微生物-药物关联数据集带来的稀疏性问题。
附图说明
[0087]
图1是本发明一种预测微生物-药物关联作用的方法的流程示意图。
[0088]
图2是本发明一种预测微生物-药物关联作用的方法构建多模态属性图的流程示意图。
[0089]
图3是本发明一种预测微生物-药物关联作用的方法得到关联概率的流程示意图。
具体实施方式
[0090]
下面结合附图和具体实施方式对本发明做详细描述。
[0091]
实施例1
[0092]
如图1所示,一种预测微生物-药物关联作用的方法,包括以下步骤:
[0093]
s1.通过微生物-药物关联数据库构建微生物-药物的关联网络,将关联网络称为net1;
[0094]
s2.通过微生物-药物关联数据库中的微生物数据库检索出微生物-微生物的相关的相互作用,通过微生物-药物关联数据库中的药物数据库检索出药物-药物的相关的相互作用;根据微生物-微生物的相关的相互作用和药物-药物的相关的相互作用构建相互作用网络,将相互作用网络称为net2;
[0095]
s3.通过药物数据库构建药物的拓扑属性网络,通过微生物数据库构建微生物基因序列;根据药物数据库中药物的综合相似性属性和药物网络药物网络拓扑属性、微生物数据库中微生物的功能相似性属性和基因组序列属性,构建微生物-药物的多模态属性图;
[0096]
s4.根据net1、net2、微生物-药物的多模态属性图,建立引入正则化的图神经网络模型;
[0097]
s5.将net1、net2结合微生物-药物的多模态属性图输入图神经网络模型得到嵌入表示z1和z2;将嵌入表示z1和z2输入图神经网络中进行训练,得到训练好图神经网络;
[0098]
s6.获取待预测数据集,通过训练好图神经网络预测待预测数据集中微生物-药物
的关联作用。
[0099]
本发明通过过微生物-药物关联数据库构建微生物-药物的关联网络,并进一步得到互作用网络net1和net2;建立引入正则化的图神经网络模型,将net1、net2结合微生物-药物的多模态属性图输入图神经网络模型得到嵌入表示z1和z2,并将嵌入表示z1和z2输入图神经网络中进行训练,得到训练好图神经网络;构建了生物和药物的可解释的节点特征,并考虑了现有微生物-药物关联数据集带来的稀疏性问题。
[0100]
实施例2
[0101]
具体的,如图2所示,在一个具体实施例中,所述的步骤s3中,通过药物数据库构建药物的拓扑属性网络,通过微生物数据库构建微生物基因序列;根据药物数据库中药物的综合相似性属性和药物网络药物网络拓扑属性、微生物数据库中微生物的功能相似性属性和基因组序列属性,构建微生物-药物的多模态属性图的具体步骤为:
[0102]
s301.根据药物数据库中的药物相似性属性构建药物的相似性特征矩阵,并通过药物数据库构建药物的拓扑属性网络,从而得到药物的第二属性特征矩阵;
[0103]
s302.根据微生物数据库中微生物的功能相似性属性构建微生物的相似性特征矩阵,并通过微生物数据库构建微生物基因序列,从而得到微生物的第二属性特征矩阵;
[0104]
s303.根据药物的相似性特征矩阵和微生物的相似性特征矩阵,构建微生物-药物相似性特征网络;
[0105]
s304.根据药物的第二属性特征矩阵和微生物的第二属性特征矩阵,构建微生物-药物第二属性特征网络;
[0106]
s305.将微生物-药物相似性特征网络和微生物-药物第二属性特征网络结合得到微生物-药物的多模态属性图。
[0107]
在一个具体实施例中,所述的步骤s301中,根据药物数据库中的药物相似性属性构建药物的相似性特征矩阵,并通过药物数据库构建药物的拓扑属性网络,从而得到药物的第二属性特征矩阵,具体步骤为:
[0108]
a1.使用simcomp2工具,计算药物数据库中的药物相似性属性,得到药物的分子结构相似度矩阵ds
struct
(di,dj);
[0109]
a2.用矩阵dip表示net2中药物-药物相互作用谱,得到标准化内核带宽:
[0110][0111]
其中,μ表示标准化内核带宽,μ

为原始带宽,设置为1,dip(di)表示药物di与其他药物的相互作用,nd表示所述net1中微生物的数量;
[0112]
a3.将药物的相似性特征矩阵表示为sd(di,dj):
[0113][0114]
a4.通过带重启的随机游走方法构建药物数据库中药物网络拓扑属性,在药物网络上进行随机漂移和重启,直到药物网络收敛,完成药物网络构建,从而得到每个药物的概率分布向量,构建药物的第二属性特征矩阵fd∈r
nd
×
nd

[0115]
在一个具体实施例中,所述的步骤a4中,随机漂移和重启的公式为:
[0116][0117]
其中,表示药物网络的第i个节点在时间t 1移动到其他节点的概率,θ是重启概率,t是转移概率矩阵,p
i(0)
∈rn×1表示药物网络的第i个节点的起始概率向量,p
i(t)
∈rn×1表示药物网络的第i个节点在时间t移动到其他节点的概率。
[0118]
在一个具体实施例中,所述的步骤s302中,根据微生物数据库中微生物的功能相似性属性构建微生物的相似性特征矩阵,并通过微生物数据库构建微生物基因序列,从而得到微生物的第二属性特征矩阵的具体步骤为:
[0119]
b1.使用kamneva工具计算生物数据库中的微生物的功能相似性属性,得到微生物的相似性特征矩阵sm∈r
nm
×
nm
,其中,nm表示net1中微生物的数量;将微生物mi和微生物mj之间的相似性表示为sm(mi,mj);
[0120]
b2.对微生物数据库中的微生物数据的原始基因序列进行编码,得到微生物基因序列;
[0121]
b3.将所有编码后的微生物基因序列用零填充,使所有填充后的微生物基因序列长度相同;
[0122]
b4.使用主成分析法对所有填充后的微生物基因序列进行分析,获得k维矩阵,将微生物的第二属性特征矩阵由k维矩阵表示为fm∈r
nm
×k。
[0123]
在一个具体实施例中,所述的步骤s303中,根据药物的相似性特征矩阵和微生物的相似性特征矩阵,构建微生物-药物相似性特征网络,具体步骤为:
[0124]
c1.根据药物的相似性特征矩阵和微生物的相似性特征矩阵,构建微生物-药物相似性特征网络x
simility

[0125][0126]
c2.根据药物的第二属性特征矩阵和微生物的第二属性特征矩阵构建微生物-药物第二属性特征网络x
secondary

[0127][0128]
c3.将微生物-药物相似性特征网络和微生物-药物第二属性特征网络结合得到微生物-药物的多模态属性图x:
[0129]
x=[x
simility
,x
secondary
]。
[0130]
在一个具体实施例中,所述的步骤s4中,根据net1、net2、微生物-药物的多模态属性图,建立引入正则化的图神经网络模型,具体步骤为:
[0131]
s401.根据微生物-药物的多模态属性图建立微生物-药物的特征矩阵,构建微生物-药物的异构矩阵,在异构矩阵里,vi表示任意一个节点的微生物或者药物,异构矩阵表示为:
[0132][0133]
其中,y为微生物-药物的特征矩阵,表示节点vi的内容特征向量;
[0134]
s402.设置可学习矩阵w∈rm×
f,并使用随机数为可学习矩阵的元素赋初值,其中,f为节点嵌入表示的维度,由超参数设定,n=nd nm为节点数,m=2
×
(nd nm)为节点的特征维度,根据和w生成经过特征变换的向量
[0135][0136]
s403.设置缩放常数s∈r,其表示传播的隐藏特征的范数,并由正则化的图神经网络模型的gncn网络生成归一化特征变换向量
[0137][0138]
s404.求得l2正则化的公式g():
[0139][0140]
s405.使用gncn编码器对微生物-药物的关联网络和微生物-药物的多模态属性图进行编码:
[0141][0142]
其中,a∈r
nd
×
nm
为步骤s1中所述关联网络的邻接矩阵,若关联网络中节点i和j之间存在已知关联,则a中元素aij设置为1,否则为0;其中in为n阶单位矩阵,为的度矩阵。
[0143]
在一个具体实施例中,如图3所示,所述的步骤s5中,将net1、net2结合微生物-药物的多模态属性图输入图神经网络模型得到嵌入表示z1和z2;将嵌入表示z1和z2输入图神经网络中进行训练,得到训练好图神经网络的具体步骤为:
[0144]
s501.通过gncn网络传播归一化向量以生成节点嵌入向量
[0145][0146]
其中,为矩阵中i的单位向量,为矩阵中j的单位向量,degi为节点i的度数;degj为节点j的度数;
[0147]
s502.根据节点嵌入向量生成节点嵌入矩阵,生成gncn编码器的隐变量z∈rn
×
f,得到net1对应的z1和net2对应的z2:
[0148]
zi=gncn(x,a,s);
[0149]
s503.定义一个损失函数,所述的损失函数为多模态属性图和训练中图神经网络得到的重构图之间的二进制交叉熵:
[0150][0151]
其中,l为损失函数,n为所有节点的总数,y代表邻接矩阵a中某个元素的值,取值为0或1,代表重构的邻接矩阵中相应元素的值,取值在0到1之间;
[0152]
s504.将z1、z2输入图神经网络模型的dnn分类器中,将训练次数epoch设置为k2,
训练的过程采用随机梯度下降,当损失函数收敛时停止训练,得到训练好的图神经网络。
[0153]
实施例3
[0154]
在一个具体实施例中,在所述的步骤s5中,训练好图神经网络模型后,还进行了图神经网络模型的验证,验证的具体步骤为:
[0155]
d1.引入k-fold交叉验证框架,在k-fold交叉验证框架下,将现有的微生物-药物关联数据库上所有已知微生物-药物关联数据随机分为k1个群,将k1个群中每一个具有相同大小批次的随机抽样未知关联对的子集选为测试集,将剩余的已知关联对选为训练集;
[0156]
d2.将测试集输入训练好的图神经网络模型中,得到分类结果;
[0157]
d3.若分类结果为正类则预测该微生物和该药物存在关联,若分类结果为负类则预测该微生物和药物不存在关联;
[0158]
d4.根据分类结果得到训练好的图神经网络模型的auc值;根据auc值,验证图神经网络模型的准确性。
[0159]
在一个具体实施例中,步骤d4中,据分类结果得到训练好的图神经网络模型的auc值,具体步骤为;
[0160]
e1.将训练集输入模型,得到当前模型对训练集的重构图,取当前模型对训练集的重构图中各节点之间边的得分,记为关联概率,关联概率取值0-1之间;
[0161]
e2.关联概率作为分类阈值,当其他关联概率大于该分类阈值时,视为预测成正样本,当其他关联概率小于该分类阈值时,视为预测成负样本;
[0162]
e3.根据训练集中微生物-药物的关联关系,得到训练集中边的标签真值,标签真值取值0或1,其中,0表示不存在边即不存在关联关系,即实际是负样本,1表示存在边即存在关联关系,即实际是正样本;
[0163]
e4.统计各分类阈值下的真阳性率和伪阳性率:
[0164][0165][0166]
其中,tprate为真阳性率,fprate为伪阳性率,tp为真阳率,表示实际是负样本预测成正样本的样本数,fn为假阴率,表示实际是正样本预测成负样本的样本数,fp为假阳率,表示实际是负样本预测成正样本的样本数,tn为真阴率,表示实际是负样本预测成负样本的样本数;
[0167]
e5.以fprate为横轴,tprate为纵轴绘制roc曲线,使用微元法计算roc曲线面积,即auc值。
[0168]
本实施例中,为了验证本发明一种基预测微生物-药物关联作用的方法,本实施例使用默认参数设置,在mdad数据集上运行本方法和5种现有方法,使用auc值作为性能评估指标,auc值越大,则方法的准确性就越高。
[0169]
本实施例中,对包括本发明在内的所有方法进行5倍交叉验证和10倍交叉验证,将经实验验证的药物组合随机分为5或10个大小相同的子集,每个子集依次用作测试集,剩余的用于训练模型。为了消除随机抽样偏差,该过程重复10次,并根据10次重复验证中auc值的平均值计算最终auc分数,以最终auc分数做性能指标评估各方法的准确性。
[0170]
验证结果如下表所示,在5倍交叉验证中,本发明采用的方法以g2gnaemda表示,本发明的最终auc分数是所有方法中最高。在10倍交叉验证中,本发明的最终auc分数也是所有方法中最高的。所以本发明的准确性优于现有方法:
[0171][0172]
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献