一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种药物相互作用的预测方法、装置、设备和存储介质与流程

2022-07-02 11:12:14 来源:中国专利 TAG:


1.本发明涉及医药技术领域,具体而言,涉及一种药物相互作用的预测方 法、装置、设备和存储介质。


背景技术:

2.当多个药物同时被服用,药物之间可能会发生意料之外的相互作用 (drug-drug interaction,ddi)。ddi对治疗可能造成有利或者有害的影响。 其中有益ddi可以产生“1 1》2”的增效作用,可以成为一种安全有效的复杂 疾病治疗方法,已被成功地应用到癌症和艾滋病等复杂疾病的治疗中。而有 害ddi也可能会导致严重的药物不良反应,从而威胁到患者生命安全。因此, 识别出药物相互作用是一项迫切且有现实意义的工作。
3.目前识别ddi重要方法是进行长期的体内体外临床实验,然而这需要耗 费大量的金钱和时间,随着药品数量日益增长,现有方法难以满足实际的应 用需求。
4.有鉴于此,申请人在研究了现有的技术后特提出本技术。


技术实现要素:

5.本发明提供了一种药物相互作用的预测方法、装置、设备和存储介质, 以改善上述技术问题。
6.第一方面、
7.本发明实施例提供了一种药物相互作用的预测方法,其包含步骤s1至步 骤s9。
8.s1、获取多种药物的特征和药物之间的反应类型。
9.s2、根据多种药物的特征,构建药物特征矩阵。
10.s3、根据多种药物之间的反应类型,构建药物邻接图。其中,药物邻接 图以药物作为节点,以反应类型作为边。
11.s4、通过深度神经网络从药物特征矩阵中抽取不同层次的特征向量。
12.s5、通过卷积神经网络从药物邻接图中抽取不同层次的结构向量。其中, 所述深度神经网络的各个层提取到的特征向量分别传输至所述卷积神经网络 的对应层中进行融合。
13.s6、通过注意力机制按权重融合深度神经网络最后一层提取到的特征向 量和卷积神经网络最后一层提取到的结构向量,获得各个药物的最终嵌入表 示。
14.s7、将各个药物的最终嵌入表示进行组合,以获得多个药物对向量。其 中,已知部分药物对向量的反应类型。
15.s8、以药物对之间的反应类型作为标签,以已知反应类型的药物对向量 作为训练数据集,训练得到分类模型。
16.s9、通过分类模型,预测未知反应类型的药物对向量的反应类型。
17.第二方面、
18.本发明实施例提供了一种药物相互作用的预测装置,其包含:
19.原始数据处理模块,获取多种药物的特征和药物之间的反应类型,并且 根据多种药物的特征,构建药物特征矩阵,以及根据多种药物之间的反应类 型,构建药物邻接图。其中,药物邻接图以药物作为节点,以反应类型作为 边。
20.药物特征信息提取模块,用于通过深度神经网络从药物特征矩阵中抽取 不同层次的特征向量。
21.邻居拓扑结构信息提取模块,用于通过卷积神经网络从药物邻接图中抽 取不同层次的结构向量。其中,深度神经网络的各个层提取到的特征向量分 别传输至卷积神经网络的对应层中进行融合。
22.融合模块,用于通过注意力机制按权重融合深度神经网络最后一层提取 到的特征向量和卷积神经网络最后一层提取到的结构向量,获得各个药物的 最终嵌入表示。
23.组合模块,用于将各个药物的最终嵌入表示进行组合,以获得多个药物 对向量。其中,已知部分药物对向量的反应类型。
24.模型训练模块,用于以药物对之间的反应类型作为标签,以已知反应类 型的药物对向量作为训练数据集,训练得到分类模型。
25.链接预测模块,用于通过分类模型,预测未知反应类型的药物对向量的 反应类型。
26.第三方面、
27.本发明实施例提供了一种药物相互作用的预测设备,其包括处理器、存 储器,以及存储在存储器内的计算机程序。计算机程序能够被处理器执行, 以实现如第一方面任意一段所说的药物相互作用的预测方法。
28.第四方面、
29.本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质包 括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质 所在设备执行如第一方面任意一段所说的药物相互作用的预测方法。
30.通过采用上述技术方案,本发明可以取得以下技术效果:
31.通过对药物特征与拓扑关系进行了有效的深度融合,可以捕捉到丰富的 信息,学到有代表性及鲁棒性的药物向量表示,从而确保在下游任务中取得 良好的预测性能。采用注意力机制,根椐不同模型组件对预测任务的重要性 分配不同的权重,给预测贡献小的模型组件分配较低的比重,可以有效解决 噪音对模型干扰。从而实现更高效的融合,同时注意力值的分布也可为实验 结果提供一定的可解释性。预测出的结果是多类别的,在前面确保预测精度 更高的情况下,实现预测结果更细。它不仅指示有无相互作用,还可以指示 出具体病理性描述,这有利于帮助我们理解药物不良反应背后的潜在机制, 从而采取相应的措施进行避免。
32.为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施 例,并配合所附附图,作详细说明如下。
附图说明
33.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要 使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施 例,因此不应被看作
是对范围的限定,对于本领域普通技术人员来讲,在不 付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
34.图1是本发明第一实施例提供的预测方法的流程示意图。
35.图2是本发明第一实施例提供的预测方法的逻辑框图。
具体实施方式
36.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而 不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
37.为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行 详细描述。
38.应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的 实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳 动前提下所获得的所有其它实施例,都属于本发明保护的范围。
39.在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非 旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的
ꢀ“
一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其 他含义。
40.应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联 关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a, 同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表 示前后关联对象是一种“或”的关系。
41.取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……

”ꢀ
或“当
……
时”或“响应于确定”或“响应于检测”。类似地,取决于语境, 短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当 确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应 于检测(陈述的条件或事件)”。
42.实施例中提及的“第一\第二”仅仅是是区别类似的对象,不代表针对对 象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的 顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换, 以使这里描述的实施例能够以除了在这里图示或描述的那些内容以外的顺序 实施。
43.下面结合附图与具体实施方式对本发明作进一步详细描述:
44.实施例一:
45.请参阅图1和图2,本发明第一实施例提供一种药物相互作用的预测方 法,其可由药物相互作用的预测设备来执行。特别的,其可由药物相互作用 的预测设备中的一个或多个处理器来执行,以实现步骤s1至步骤s9。
46.s1、获取多种药物的特征和药物之间的反应类型。
47.具体的,药物的特征和药物之间的反应类型,可以通过自然语言处理技 术nlp,在已知的药物不良反应事件报告、科学文献、临床实验等数据库中 搜索得到,也可以自己做实验得到,本发明对如何获取原始数据不做具体限 定。
48.其中,药物的特征可以包括化学结构、靶标、酶、通道、表征、副作用 等特征。药物
之间的反应类型可以是现有的已知的各种反应类型,本发明对 特征和反应类型的具体种类和数量不做限定。
49.可以理解的是,药物相互作用的预测设备可以是便携笔记本计算机、台 式机计算机、服务器、智能手机或者平板电脑等具有计算性能的电子设备。
50.s2、根据多种药物的特征,构建药物特征矩阵。
51.特征矩阵能够用相同格式来表示各种药物的特征,使得计算机能够高效 的进行后续处理。
52.在上述实施例的基础上,本发明的一个可选的实施例中,步骤s2具体包 括步骤s21至步骤s23:
53.s21、获取多种药物的特征,并选取预定数量个特征构建预定数量个初始 特征矩阵。具体的,多种特征包括化学结构、靶标、酶和通道。优选的,预 定数量为三个。预定数量个特征分别为化学结构、靶标、酶。
54.s22、分别计算预定数量个初始特征矩阵的相似度,以获得预定数量个相 似性矩阵。具体的,相似度为jaccard相似度。
55.s23、拼接预定数量个相似性矩阵,获得多种药物的药物特征矩阵。
56.s3、根据多种药物之间的反应类型,构建药物邻接图。其中,药物邻接 图以药物作为节点,以反应类型作为边。
57.下面以一个具体的例子来对步骤s2和步骤s3进行详细的说明。
58.选取论文ddimdl提供的数据,其中包括572个药物及四种特征,包括化 学结构(chemical substructures)、靶标(target)、酶(enzymes)、通道 (pathways),65种反应类型及37264个药物相互反应事件。
59.对于邻居关系的处理,我们把37264个事件中涉及的药物作为节点,药 物之间发生的反应类型作为边,以此构建网络图g。
60.对于药物特征的处理,我们选取ddimdl模型实验效果最好的化学子结构、 靶标、酶三个特征,把进行相似度计算后得到的三个特征矩阵进行拼接,作 为最终的特征x。
61.下面对具体的特征相似度计算过程进行介绍:
62.以特征化学结构为例,对572个药物的化学结构特征值进行遍历,将每 种药物拆分后得到的化学子结构追加到集合中,最终可以得到583种不重复 的化学子结构类型。因此每种药物可以用583位的二进制表示,“1”表示该 药物有相应的化学子结构特征,“0”表示没有,最终可以得到形状为(572, 583)的二进行化学结构矩阵。
63.对特征靶标、酶进行同样处理,但由于特征矩阵维度过高,并且存在很 多的0值,并且很多存在多数的0值,因此我们通过公式(1)计算jaccard 相似度,用得到的相似度矩阵代替之前的二进制矩阵来缓解0值过多导致的 稀疏性问题。
[0064][0065]
经过相似性计算后,可以得到(572,572)大小的化学结构相似性矩阵 表示xs∈r
nd
×k,同样特征靶标和酶经过处理后得到靶标相似性矩阵表示 x
t
∈r
nd
×k,酶相似性矩阵表示xe∈r
nd
×k,用三个特征矩阵的拼接的方式来表 示药物最终的特征矩阵x,其中药物di的特征表示如公式(2)所示。其中

表 示concatenate连接方式。
[0066][0067]
有了前两步得到的数据基础,接下来需要从中提取需要的特征。在本发 明中,通过深度神经网络(dnn)从药物特征矩阵中提取药物的自身的特征信息。 通过卷积神经网络(gcn)药物邻接图中提取药物之间的结构拓扑信息。
[0068]
其中,深度神经网络包括逐层连接的多个自编译器模型ae,用于特征抽 取。卷积神经网络包括逐层连接的多个图卷积模型,用于拓扑结构的抽取。 其中,多个自编译器模型ae和多个图卷积模型gcn一一对应。具体提取特征 的步骤如s4和s5所述。
[0069]
s4、通过深度神经网络从药物特征矩阵中抽取不同层次的特征向量。
[0070]
具体的,dnn层采用自编码器ae从原始数据中学到潜在的特征表示,它 是一种无监督的学习方式,从数据本身进行学习,利用重构损失最小进行训 练。ae不但能够快速捕获输入与输出之间的非线性变化,经过多层神经网络 可以有效地提取出具有层次结构的特征向量。
[0071]
如图2所示,在上述实施例的基础上,本发明的一个可选的实施例中, 步骤s4具体用于:通过深度神经网络的多个自编译器模型ae,从药物特征 矩阵中逐层提取节点属性信息,直至最后一层提取到药物特征信息。其中, 节点属性信息用于传输至下一层自编译器模型ae和对应的图卷积模型。
[0072]
优选的,针对三类异构特征相似性矩阵的融合以及融合后导致维度过高 的问题,ae也是一种理想的降维与特征融合的方法。它主要包括编码器与解 码器两部分。编码器采用gcn实现降维,我们把降维后得到的向量当作药物 的潜在特征。
[0073]
假设ae共有l层,用h
(l)
表示第l层学到的嵌入,则自编译器模型ae的表 达式如公式(3)所示:
[0074][0075]
其中,h
(l)
为第l层提取到的潜在特征信息,为sigmoid激活函数,和分别是第l层的权重矩阵和偏置矩阵,h
(l-1)
为第l-1层提取到的潜在特征信息, h
(0)
表示药物特征矩阵x。
[0076]
具体的,深度神经网络的自编译器模型ae的层数,以及每层的节点数量 可以根据实际需要进行设置,本发明对此不做具体限定。
[0077]
下面接着步骤s3中所说的具体的例子来对步骤s4和步骤s5进行详细的 说明。
[0078]
在本实施例中,深度神经网络设置包括五层自编译器模型ae,五层自编 译器模型ae的节点个数分别为500,500,2000,256和65。输入的特征维 度为1716维,它是将3个维度为572的特征相连接得到的,最后一层固定节 点个数为65,因为最终预测结果有65类ddi事件,药物对的向量表示维度 必须与标签的种类数一致。然后再渐渐增加层数,探究层数对实验结果的影 响。
[0079]
本模型超参数的学习率设置为0.003,epoch设置为200,因为当epoch 为200时,损失曲线基本不变化。然后选取adam优化器,进行五折交叉验证。
[0080]
s5、通过卷积神经网络从药物邻接图中抽取不同层次的结构向量。其中, 深度神经网络的各个层提取到的向量分别传输至所述卷积神经网络的对应层 中进行融合。
[0081]
具体的,ae可以从自身特征数据中学到每层的重要信息,例如h
(1)
, h
(2)
……h(l)
,但它忽略了样本之间的结构关系。图卷积神经网络gcn在聚合 邻居信息方面取得良好的效果,受此影响,我们也采用gcn模型提取药物的 拓扑结构信息,然后与传输得到的药物特征表示进行融合。
[0082]
所述层内融合,具体为:当前图卷积模型融合上一层图卷积模型提取到 的结构向量和上一层图卷积模型对应的自编译器模型ae学习到的特征向量; 其中,上一层图卷积模型对应的自编译器模型ae学习到的特征向量,通过传 输层传输至所述当前图卷积模型。。
[0083]
如图2所示,在上述实施例的基础上,本发明的一个可选的实施例中, 步骤s5具体用于:通过卷积神经网络的多个图卷积模型,从药物邻接图中逐 层提取结构向量,直至最后一层提取到最终的结构向量。其中,当前图卷积 模型用于融合上一层图卷积模型提取到的结构向量和接收到的特征向量,并 对融合后的向量进行卷积得到当前层的结构向量。
[0084]
假设图卷积模型共有l层,用z
(l)
表示第l层学到的潜在向量,则图卷积模 型的表达式为:
[0085][0086]
其中,
[0087][0088]
其中,z
(l)
为第l层的邻居拓扑结构信息,为sigmoid激活函数,为度矩 阵,a

为自环矩阵,w
(l-1)
为第l-1层的权重变换矩阵,ε为平衡因子,z
(l-1)
为 第l-1层的邻居拓扑结构信息,h
(l-1)
为第l-1层提取到的潜在特征信息。
[0089]
具体的,gcn模块第l层的潜在向量表示可以由公式(4)通过卷积获得, 其中为自环矩阵,即在邻接矩阵a的基础上加上一个单位矩阵i, z为特征矩阵,自环矩阵乘以特征矩阵将得到邻居结点和自身的全部特征和。 为度矩阵,w为权重变换矩阵.
[0090]
将第(l-1)层融合邻居后的信息转换到第l层作为输出。
[0091][0092]
考虑到自编码器ae能从特征中获取不同的信息,我们通过公式(5)组 合两部分来获取表达能力更强的药物向量表示z。
[0093]
其中,z
(0)
表示药物邻接图,h
(0)
表示药物特征矩阵。
[0094][0095]
ε为平衡因子,用于控制gcn模型与ae模型所学向量的融合比重,通过 按比融合后得到第l-1层的嵌入表示再把它输入第l层的gcn中,得 到表示向量z
(l)
,如公式(6)所示。
[0096][0097]
如图2所示,需要说明的是,gcn和dnn的层与层之间,通过convey操 作把ae学到的
节点属性信息与gcn模块学到的潜在向量表示根据平衡因子占 比进行融合,这样获得的表示将能够适应两种不同类型的信息,即数据本身 和数据之间的关系。再进行逐层融合后,最终能保留不同层次融合了节点特 征与拓扑关系的信息。
[0098]
具体的,通过中间的convey操作它可以使上下两模块相互促进,1、gcn 可以为ae提供二阶约束,更好的学习特征的抽象表示,2、ae抽取不同阶信 息,传输到gcn中,可以缓解gcn进行多层融合时的过平滑问题。
[0099]
s6、通过注意力机制按权重融合深度神经网络最后一层提取到的特征向 量和卷积神经网络最后一层提取到的结构向量,获得各个药物的最终嵌入表 示。
[0100]
具体的,gcn直接把特征和邻接矩阵作为输入,gcn在聚合过程中可能受 到一定噪声邻居干扰,导致模型的效果并没有充分发挥。注意力机制可以根 据模型组件对预测结果的重要程度分配相应的权重,给预测贡献小的模型组 件分配较低的比重,从而有效解决噪音对模型干扰的问题。
[0101]
如图2所示,在上述实施例的基础上,本发明的一个可选的实施例中, 步骤s6具体用于采用注意力机制,融合特征信息和邻居拓扑结构信息,获得 各个药物的最终嵌入表示。注意力机制模型为:
[0102][0103]
其中,ei为第i种药物的最终嵌入表示,z为最后一层图卷积模型gcn提取到 的结构向量,为第i种药物的结构向量对应的注意力值,h为最后一层自编 译器模型ae提取到的特征向量,为第i种药物的特征向量对应的注意力值。
[0104]
注意力机制的具体实现过程如下:
[0105]
例如,在输出层之前的第l层,已经获得gcn融合后的向量表示z
(l)
与ae 模块获得的向量表示h
(l)
,注意力机制的计算如公式(9)所示:
[0106]
(αz,αh)=att(z,h)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(9)
[0107]
αz,αh分别表示通过gcn模块、ae模块获得的嵌入对应的注意力系数。
[0108]
以节点i为例,它在z中的嵌入表示为zi,我们首先把嵌入通过非线性变 换进行转换,用一个共享的注意力向量q来获得拓扑结构嵌入的注意力值如公式(10)所示:
[0109][0110]
其中,w是权重矩阵,b为偏置向量,
[0111]
同样的,我们可以得到自身特征嵌入的注意力值
[0112]
然后,使用softmax正则化注意力的值,来获得拓扑结构嵌入的最终的 权重系数,如公式(11)所示:
[0113][0114]
同样的,经过公式我们可以得到自身特征嵌入的注 意力系数。具体的,
[0115][0116]
其中,
[0117][0118]
对于所有的节点n,学到权重系数αz=[αz],αh=[αh],相应地表示为 αz=diag(αz),αh=diag(αh),然后组合两个嵌入获得它最终的药物嵌入表 示向量e,如公式(12)所示:
[0119]
e=αz·
z αh·hꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0120]
可以理解的是,上述注意力机制的实现过程只是简要说明,注意力系数 的如何获取属于现有技术,本发明不再赘述。
[0121]
需要说明的是,本发明实施例创新性的提出了深度融合药物的结构特征 和邻居特征,使得药物的最终嵌入表示能够包含更多的特征,以更加准确的 对药物对的反应类型进行预判,具有很好的实际意义。其中,深度融合包含 层内融合、层间融合和最终融合。其中,层内融合是指:所述深度神经网络 的各个层提取到的特征向量分别传输至所述卷积神经网络的对应层中进行层 内融合。层间融合是指:以前一层图卷积模型gcn在层内融合后获得的结构 向量又作为后一层图卷积模型gcn的潜在特征输入,实现药物自身特征与拓 扑信息在层间的传递。最终融合是指:通过注意力机制融合深度神经网络最 后一层提取到的特征向量和卷积神经网络最后一层提取到的结构向量。
[0122]
s7、已知部分药物对向量的反应类型。
[0123]
具体的,通过前面的深度融合已经获得所有药物的嵌入表示e,假设两 个药物i,j的向量表示分别为ф(di)和ф(dj)。在本实施例中,通过四种方式组 合成药物对向量表示,如下表所示:
[0124]
表1、四种不同的药物对组合方式
[0125][0126][0127]
表中符号

表示hadamard积,符号表示concatenate连接。
[0128]
可以理解的是,在其它实施例中,可以使用其它的组合方式,而不限于 上述的四种组合方式。
[0129]
s8、以药物对之间的反应类型作为标签,以已知反应类型的药物对向量 作为训练数据集,训练得到分类模型。
[0130]
s9、通过所述分类模型,预测未知反应类型的药物对向量的反应类型。
[0131]
在上述实施例的基础上,本发明的一个可选的实施例中,s8具体包括步 骤s81至步骤s83。
[0132]
s81、获取药物对的相互作用类型。
[0133]
s82、获取已知反应类型的药物对向量。
[0134]
s83、以药物对之间的反应类型作为标签,以已知反应类型的药物对向量 作为训练数据集,输入交叉熵损失函数中,进行有监督的训练,以获得所述 分类模型。
[0135]
具体的,通过组合后获得药物对向量表示,再把药物对反应类型作为标 签。因为本专利研究多类别的ddi预测,所以采用交叉熵损失函数进行训练。 假设训练集为l,类别数为c,某个药物对i∈l,真实的标签为表 其中表示药物对i预测属于类别c 的概率,n个药物对的类别预测表示为y=[y
ic
]∈r
nd
×k然后 对于训练集中所有节点的交叉熵损失计算如公式(13)所示:
[0136][0137]
本发明实施例通过对药物特征与拓扑关系进行了有效的深度融合,可以 捕捉到丰富的信息,学到有代表性及鲁棒性的药物向量表示,从而确保在下 游任务中取得良好的预测性能。采用注意力机制,根椐不同模型组件对预测 任务的重要性分配不同的权重,给预测贡献小的模型组件分配较低的比重, 可以有效解决噪音对模型干扰。从而实现更高效的融合,同时注意力值的分 布也可为实验结果提供一定的可解释性。预测出的结果是多类别的,在前面 确保预测精度更高的情况下,实现预测结果更细。它不仅指示有无相互作用, 还可以指示出具体病理性描述,这有利于帮助我们理解药物不良反应背后的 潜在机制,从而采取相应的措施进行避免。
[0138]
本发明提出将药物特征与拓扑关系进行结合,通过深度融合的策略得到 抽象、高级的药物表示。此外,区别于传统预测结果为二进制类型ddi方法, 本发明预测的结果为多类别,每一种类别对应一种具体的药代动力学描述, 这有利于帮助使用者了解ddi背后发生机制,提供医学见解。
[0139]
本发明提出了一种药物相互作用的预测方法,它通过convey操作聚合特 征与邻居拓扑信息,并且进行逐层融合,最终通过端对端的训练获得信息量 丰富的药物嵌入表示。在多个数据集上进行链接预测任务、分类任务实验时, 提出的模型都持续表现出最优性能,证明它具有良好的鲁棒性。
[0140]
实施例二:
[0141]
本发明第二实施例提供一种药物相互作用的预测装置,其包含:
[0142]
原始数据处理模块,获取多种药物的特征和药物之间的反应类型,并且 根据多种药物的特征,构建药物特征矩阵,以及根据多种药物之间的反应类 型,构建药物邻接图。其中,药物邻接图以药物作为节点,以反应类型作为 边。
[0143]
药物特征信息提取模块,用于通过深度神经网络从药物特征矩阵中抽取 不同层次的特征向量。
[0144]
邻居拓扑结构信息提取模块,用于通过卷积神经网络从药物邻接图中抽 取不同
层次的结构向量。其中,深度神经网络的各个层提取到的特征向量分 别传输至卷积神经网络的对应层中进行融合。
[0145]
融合模块,用于通过注意力机制按权重融合深度神经网络最后一层提取 到的特征向量和卷积神经网络最后一层提取到的结构向量,获得各个药物的 最终嵌入表示。
[0146]
组合模块,用于将各个药物的最终嵌入表示进行组合,以获得多个药物 对向量。其中,已知部分药物对向量的反应类型。
[0147]
模型训练模块,用于以药物对之间的反应类型作为标签,以已知反应类 型的药物对向量作为训练数据集,训练得到分类模型。
[0148]
链接预测模块,用于通过分类模型,预测未知反应类型的药物对向量的 反应类型。
[0149]
通过对药物特征与拓扑关系进行了有效的深度融合,可以捕捉到丰富的 信息,学到有代表性及鲁棒性的药物向量表示,从而确保在下游任务中取得 良好的预测性能。采用注意力机制,根椐不同模型组件对预测任务的重要性 分配不同的权重,给预测贡献小的模型组件分配较低的比重,可以有效解决 噪音对模型干扰。从而实现更高效的融合,同时注意力值的分布也可为实验 结果提供一定的可解释性。预测出的结果是多类别的,在前面确保预测精度 更高的情况下,实现预测结果更细。它不仅指示有无相互作用,还可以指示 出具体病理性描述,这有利于帮助我们理解药物不良反应背后的潜在机制, 从而采取相应的措施进行避免。
[0150]
在上述实施例的基础上,本发明一可选的实施例中,药物自身特征抽取 模块具体包括:
[0151]
初始特征单元,用于获取多种药物的特征,并选取预定数量个特征构建 预定数量个初始特征矩阵。
[0152]
相似性单元,用于分别计算预定数量个初始特征矩阵的相似度,以获得 预定数量个相似性矩阵。
[0153]
拼接单元,用于拼接预定数量个相似性矩阵,获得多种药物的药物特征 矩阵。
[0154]
在上述实施例的基础上,本发明一可选的实施例中,药物的特征包括化 学结构、靶标、酶和通道,预定数量为三个。
[0155]
在上述实施例的基础上,本发明一可选的实施例中,相似度为jaccard 相似度。
[0156]
在上述实施例的基础上,本发明一可选的实施例中,所述深度神经网络 包括多个自编译器模型ae,用于特征抽取;所述卷积神经网络包括多个图卷 积模型,用于拓扑结构的抽取;其中,所述多个自编译器模型ae和所述多个 图卷积模型一一对应。
[0157]
在上述实施例的基础上,本发明一可选的实施例中,所述层内融合,具 体为:当前图卷积模型融合上一层图卷积模型提取到的结构向量和上一层图 卷积模型对应的自编译器模型ae学习到的特征向量;其中,上一层图卷积模 型对应的自编译器模型ae学习到的特征向量,通过传输层传输至所述当前图 卷积模型。。
[0158]
在上述实施例的基础上,本发明一可选的实施例中,自编译器模型ae为:
[0159][0160]
其中,h
(l)
为第l层提取到的潜在特征信息,为sigmoid激活函数,和分
别是第l层的权重矩阵和偏置矩阵,h
(l-1)
为第l-1层提取到的潜在特征信息, h
(0)
表示药物特征矩阵x。
[0161]
在上述实施例的基础上,本发明一可选的实施例中,第l层图卷积模型提 取到的结构向量表示为:
[0162][0163]
其中,
[0164][0165]
其中,为sigmoid激活函数,为度矩阵,为自环矩阵,w
(l-1)
为第l-1层 的权重变换矩阵,ε平衡因子,z
(l-1)
为第l-1层的邻居拓扑结构信息,h
(l-1)
为 第l-1层提取到的潜在特征信息。
[0166]
在上述实施例的基础上,本发明一可选的实施例中,融合模块具体用于:
[0167]
采用注意力机制,融合特征信息和邻居拓扑结构信息,获得各个药物的 最终嵌入表示。
[0168]
注意力机制模型为:
[0169][0170]
其中,ei为第i种药物的最终嵌入表示,z为最后一层图卷积模型gcn提取到 的结构向量,为第i种药物的结构向量对应的注意力系数,h为最后一层自 编译器模型ae提取到的特征向量,为第i种药物的特征向量对应的注意力 系数。
[0171]
在上述实施例的基础上,本发明一可选的实施例中,组合最终嵌入表示 的组合的方式包括average、hadamard、l1 norm和concatenate。
[0172]
在上述实施例的基础上,本发明一可选的实施例中,模型训练模块具体 包括:
[0173]
第一获取单元,用于获取药物对的相互作用类型;
[0174]
第二获取单元,用于获取已知反应类型的药物对向量;
[0175]
训练单元,用于以药物对之间的反应类型作为标签,以已知反应类型的 药物对向量作为训练数据集,输入交叉熵损失函数中,进行有监督的训练, 以获得所述分类模型。
[0176]
实施例三:
[0177]
本发明第三实施例提供一种药物相互作用的预测设备,其包括处理器、 存储器,以及存储在存储器内的计算机程序。计算机程序能够被处理器执行, 以实现如实施例一任意一段所说的药物相互作用的预测方法。
[0178]
实施例四、
[0179]
本发明第四实施例提供一种计算机可读存储介质,计算机可读存储介质 包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介 质所在设备执行如实施例一任意一段所说的药物相互作用的预测方法。
[0180]
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和 方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是 示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的 装置、方法和计算机程序产品的可
能实现的体系架构、功能和操作。在这点 上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分, 所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能 的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注 的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实 际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及 的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/ 或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件 的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0181]
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独 立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形 成一个独立的部分。
[0182]
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用 时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的 技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可 以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中, 包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或 者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述 的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、 随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以 存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或 者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过 程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其 他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在 没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在 包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0183]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本 领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护 范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献