一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多视图图卷积网络的微生物-疾病关联预测方法

2022-04-16 12:18:09 来源:中国专利 TAG:


1.本发明属于医疗数据处理技术领域,尤其涉及一种基于多视图图卷积网络的微生物-疾病关联预测方法。


背景技术:

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
3.随着深度测序技术和微生物学的发展,越来越多的证据表明,寄生在人类体内的微生物可以调节各种寄主生理现象,从而参与多种疾病的发病机制。由于生物学数据的可用性越来越高,需要进一步研究建立有效的计算模型来预测潜在的关联。特别是,计算方法还可以缩短新的微生物疾病关联的发现周期,并进一步促进疾病治疗、药物设计和其他科学活动。
4.尽管已有的方法实现了准确的预测,但仍存在一定的局限性。例如,在计算相似度时,由于存在噪声,它们不能有效地利用实验数据。此外,基于图和随机游走算法的方法无法捕获微生物与疾病之间的非线性关系。所以预测方法需要设计成具有更可靠和优良的预测能力,这将有利于预测潜在的未知的微生物-疾病的相互作用。


技术实现要素:

5.为了解决上述背景技术中存在的至少一项技术问题,本发明提供一种基于多视图图卷积网络的微生物-疾病关联预测方法及系统。基于多种相似性计算方法构建多个相似性视图,并结合图卷积网络(gcn)、注意力机制和卷积神经网络(cnn)获取多个视图特征的多通道嵌入结果,充分挖掘了微生物和疾病之间的潜在关联,保证了预测精度。
6.为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
7.一种基于多视图多通道图卷积网络的微生物-疾病关联预测方法,包括以下步骤:
8.获取微生物和疾病的对应关系数据,构建邻接矩阵;
9.根据邻接矩阵,分别基于多种相似性计算方法,获取多个微生物相似性视图和多个疾病相似性视图;
10.基于所述多个微生物相似性视图和多个疾病相似性视图,依次经由图卷积网络、多通道注意力网络和卷积神经网络,学习微生物多视图特征嵌入和疾病多视图特征嵌入;
11.根据微生物多视图特征嵌入和疾病多视图特征嵌入,得到微生物和疾病之间的相关预测矩阵。
12.进一步地,获取微生物和疾病的对应关系数据,还对其进行预处理,删除重复数据。
13.进一步地,所述邻接矩阵的每一行表示一种微生物,每一列表示一种疾病,矩阵中的元素表示相应微生物和疾病之间是否有关。
14.进一步地,多种相似性计算方法包括高斯相互作用剖面核相似性和余弦相似性。
15.进一步地,所述图卷积网络用于从微生物和疾病的多个相似性网络中学习微生物和疾病的多视图特征。
16.进一步地,所述多通道注意力网络用于自适应的为不同通道的特征赋予权重。
17.进一步地,所述方法还包括:根据微生物和疾病之间的相关预测矩阵,基于邻接矩阵,使用矩阵补全来预测潜在的微生物与疾病的关联。
18.一个或多个实施例提供了一种基于多视图多通道图卷积网络的微生物-疾病关联性预测系统,包括:
19.已知关联性获取模块,被配置为获取微生物和疾病的对应关系数据,构建邻接矩阵;
20.相似性计算模块,被配置为根据邻接矩阵,分别基于多种相似性计算方法,获取多个微生物相似性视图和多个疾病相似性视图;
21.多视图多通道特征学习模块,被配置为基于所述多个微生物相似性视图和多个疾病相似性视图,依次经由图卷积网络、多通道注意力网络和卷积神经网络,学习微生物多视图特征嵌入和疾病多视图特征嵌入;
22.微生物与疾病的关联预测模块,被配置为根据微生物多视图特征嵌入和疾病多视图特征嵌入,得到微生物和疾病之间的相关预测矩阵。
23.一个或多个实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的微生物-疾病关联性预测方法。
24.一个或多个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的微生物-疾病关联性预测方法。
25.以上一个或多个技术方案存在以下有益效果:
26.基于多种相似性计算方法充分挖掘微生物之间以及疾病之间的相似性,获取多个相似性视图,然后基于所述多个相似性视图学习嵌入特征,从而充分挖掘了微生物和疾病之间的潜在关联,保证了后续预测任务的准确性。
27.学习嵌入特征时,引入图卷积网络、注意力机制和卷积神经网络,分别用于学习多视图特征、为多视图特征赋予重要性以及得到最终的嵌入结果,能够进一步地提高微生物-疾病之间的关联预测精度。
附图说明
28.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
29.图1为本发明一个或多个实施例中基于多视图多通道图卷积网络的微生物-疾病关联性预测方法流程图。
具体实施方式
30.应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
31.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
32.在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
33.实施例一
34.本实施例公开了一种基于多视图多通道图卷积网络的微生物-疾病关联性预测方法,具体包括以下步骤:
35.步骤1:获取微生物和疾病的对应关系数据,并进行预处理,构建邻接矩阵;
36.其中,所述邻接矩阵的每一行表示一种微生物,每一列表示一种疾病,矩阵中的元素表示相应微生物和疾病之间是否有关,具体地,若有关,元素值为1,若无关,元素值为0。
37.对微生物—疾病数据进行预处理具体包括:过滤重复数据。
38.步骤2:根据邻接矩阵,获取微生物和疾病的多个相似性视图;具体包括:
39.步骤2.1:分别计算微生物高斯相互作用剖面核相似性、疾病高斯相互作用剖面核相似性。
40.所述微生物高斯相互作用剖面核相似性计算公式如下:
41.km(m(i),m(j))=exp(-λm||ip(m(i))-ip(m(j))||2)
[0042][0043]
所述疾病高斯相互作用剖面核相似性计算公式如下:
[0044]
kd(d(i),d(j))=exp(-λm||ip(d(i))-ip(d(j))||2)
[0045][0046]
其中,将gip(d(i))和gip(m(i))分别表示为疾病d(i)和微生物m(i)的相互作用剖面,其中,λd和λm表示归一化内核带宽,原始带宽,λ
′d和λ
′m通常两者都设置为1。
[0047]
步骤2.2:微生物余弦相似性、疾病余弦相似性。
[0048]
所述微生物余弦相似性计算公式如下:
[0049][0050]
其中md(i,:)表示邻接矩阵md的第i行,md(j,:)表示邻接矩阵md的第j行。
[0051]
所述疾病余弦相似性计算公式如下:
[0052][0053]
md(:,i)即,邻接矩阵md的第i列,md(:,j)即,邻接矩阵md的第j列。
[0054]
步骤3:使用图卷积网络(gcn)分别从微生物和疾病的多个相似性网络中学习微生物和疾病的多视图特征;
[0055]
具体地,gcn处理图结构并聚合来自邻居节点的信息。为了获取不同相似视图的结构信息,本文使用gcn分别作用于不同的视图。微生物与疾病的嵌入性是利用gcn作用于微生物与疾病的不同相似性视图得出的。我们定义的是微生物的第p个视图和疾病的第q个视图。学习得到的微生物xi的特征,特征{x
i1
,x
i2
,...,x
im
}分别属于其在视图p中的邻居{i1,i2,...,im}的特征。在学习嵌入时,同时考虑节点本身及其邻居节点。
[0056]
在微生物视图p中,整个图的gcn定义如下:
[0057][0058]
其中表示微生物在视图p上的l层gcn嵌入,nm表示微生物的数量,fm表示维度。是一个随机初始化的嵌入。是参数矩阵。具体来说,表示在视图p上具有自循环的归一化相似度权重矩阵。表示对角矩阵,
[0059]
同样,对于疾病视图q,整个图的gcn定义如下:
[0060][0061]
因此,我们可以得到视图p和实体q中的嵌入矩阵如下:
[0062][0063][0064]
其中l表示gcn的层数。
[0065]
因此微生物和疾病的多个相似网络使用多层gcn编码如下:
[0066][0067][0068]
步骤4:使用多通道注意力机制自适应的学习不同视图的特征。
[0069]
具体地,我们使用gcn来作用于微生物和疾病的多个相似网络。提取的节点特征包含不同的信息,我们使用注意力机制来获得更重要的特征。如微生物特征经过多通道注意力机制,最终得到归一化的通道信息类似的,疾病的归一化的通道信息
[0070]
步骤5:利用卷积神经网络(cnn)分别得到最终的微生物和疾病的嵌入结果;
[0071]
具体地,得到微生物的多通道特征后,利用cnn提取特征,cnn的输入是微生物的通道信息最终得到融合多视图信息的微生物嵌入疾病嵌入
[0072]
步骤6:微生物与疾病的最终相关预测矩阵计算如下:
[0073][0074]
最后,我们把与疾病相关的微生物识别问题作为推荐任务,并使用矩阵补全来预测潜在的微生物与疾病的关联。
[0075]
实施例二
[0076]
本实施例的目的是提供一种基于多视图多通道图卷积网络的微生物-疾病关联性预测系统,包括:
[0077]
已知关联性获取模块,被配置为获取微生物和疾病的对应关系数据,构建邻接矩阵;
[0078]
相似性计算模块,被配置为根据邻接矩阵,分别基于多种相似性计算方法,获取多个微生物相似性视图和多个疾病相似性视图;
[0079]
多视图多通道特征学习模块,被配置为基于所述多个微生物相似性视图和多个疾病相似性视图,依次经由图卷积网络、多通道注意力网络和卷积神经网络,学习微生物多视图特征嵌入和疾病多视图特征嵌入;
[0080]
微生物与疾病的关联预测模块,被配置为根据微生物多视图特征嵌入和疾病多视图特征嵌入,得到微生物和疾病之间的相关预测矩阵。
[0081]
实施例三
[0082]
本实施例的目的是提供一种电子设备。
[0083]
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤,包括:
[0084]
获取微生物和疾病的对应关系数据,构建邻接矩阵;
[0085]
根据邻接矩阵,分别基于多种相似性计算方法,获取多个微生物相似性视图和多个疾病相似性视图;
[0086]
基于所述多个微生物相似性视图和多个疾病相似性视图,依次经由图卷积网络、多通道注意力网络和卷积神经网络,学习微生物多视图特征嵌入和疾病多视图特征嵌入;
[0087]
根据微生物多视图特征嵌入和疾病多视图特征嵌入,得到微生物和疾病之间的相关预测矩阵。
[0088]
最后,我们把与疾病相关的微生物识别问题作为推荐任务,并使用矩阵补全来预测潜在的微生物与疾病的关联。
[0089]
实施例四
[0090]
本实施例的目的是提供一种计算机可读存储介质。
[0091]
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行以下步骤:
[0092]
获取微生物和疾病的对应关系数据,构建邻接矩阵;
[0093]
根据邻接矩阵,分别基于多种相似性计算方法,获取多个微生物相似性视图和多个疾病相似性视图;
[0094]
基于所述多个微生物相似性视图和多个疾病相似性视图,依次经由图卷积网络、多通道注意力网络和卷积神经网络,学习微生物多视图特征嵌入和疾病多视图特征嵌入;
[0095]
根据微生物多视图特征嵌入和疾病多视图特征嵌入,得到微生物和疾病之间的相关预测矩阵。
[0096]
最后,我们把与疾病相关的微生物识别问题作为推荐任务,并使用矩阵补全来预测潜在的微生物与疾病的关联。
[0097]
以上实施例二至四中涉及的各步骤与方法实施例一相对应,具体实施方式可参见
实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
[0098]
以上一个或多个实施例中,首先,我们使用图卷积网络分别从微生物和疾病的多个相似性网络中学习微生物和疾病的多视图特征。其次,我们不是简单地集成多源信息,而是利用对多个特征的注意机制自适应地学习不同特征的重要性。然后利用卷积神经网络得到最终的嵌入结果。最后,我们把与疾病相关的微生物识别问题作为推荐任务,并使用矩阵补全来预测潜在的微生物与疾病的关联,有效提高了预测的准确率。
[0099]
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
[0100]
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献