一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

药物组合协同性确定方法、装置、电子设备及介质与流程

2022-11-19 07:56:12 来源:中国专利 TAG:


1.本技术涉及计算机技术领域,尤其涉及一种药物组合协同性确定方法、装置、电子设备及介质。


背景技术:

2.目前,抗癌药物联合疗法被认为是一种很有前途的治疗策略,在肿瘤的临床治疗中广泛应用。与单药相比,可显著减少药物剂量或毒副作用,增强或维持相同的功效。然而,药物联合作用也有可能是不利的,甚至会缩短癌症患者的无进展生存期。一般来说,药物联合的相互作用分为三种类型:加性相互作用(药物组合的效果等于单个药物单独服用的效果之和),协同作用(药物组合的效果优于单个药物单独服用的疗效之和)和拮抗相互作用(药物组合的效果小于单个药物的效果之和)。因此,判断药物组合是否为协同作用有着重要意义。
3.随着高通量筛选和虚拟筛选成为现代药物研究方法的重要组成部分,计算机仿真实验在生物医学科学中的应用越来越广泛,利用计算模型去预测药物组合的协同性为一种重要的解决方法。


技术实现要素:

4.本技术提供了一种药物组合协同性确定方法、装置、电子设备及介质。
5.第一方面,本技术实施例提供了一种药物组合协同性确定方法,包括:
6.获取待测药物组合中每种药物的药物信息以及待检测的细胞系信息,所述细胞系信息包括:mrna的表达信息以及基因突变信息,所述表达信息包括:每个细胞系的表达均值序列以及表达标准差序列;
7.基于所述表达均值序列以及所述表达标准差序列,得到每个细胞系的初始表达特征序列,将所述初始表达特征序列输入预先训练的自编码器进行特征提取,得到降维后的表达特征序列;
8.基于所述药物信息、所述基因突变信息、所述降维后的表达特征序列以及预先训练的深度学习模型,确定所述待测药物组合对待检测的细胞系是否具有协同性。
9.进一步地,所述基于所述表达均值序列以及所述表达标准差序列,得到每个细胞系的初始表达特征序列,包括:
10.分别针对每个细胞系的每个表达维度,基于预设的随机变量以及所述表达维度的表达标准差,得到所述表达维度的扰动量,并基于所述表达维度的表达均值以及所述扰动量,得到所述表达维度的初始表达特征;
11.基于每个细胞系的每个表达维度的初始表达特征,构成每个细胞系的初始表达特征序列。
12.进一步地,所述随机变量为离散型随机变量,所述随机变量的取值包括:0、1、-1,其中,所述随机变量取0的概率为p,所述随机变量取-1的概率为(1-p)/2,所述随机变量取1
的概率为(1-p)/2,p为大于0且小于1的数。
13.进一步地,所述随机变量为连续型随机变量,取值为-1到1,且所述随机变量取值满足均值为0,标准差为1的分布。
14.进一步地,所述自编码器基于预设损失函数训练得到,所述自编码器包括编码层、中间层以及解码层;
15.其中,所述中间层用于输出降维后的表达特征序列,所述预设损失函数的值基于所述解码层的解码结果与输入所述编码层的初始表达特征序列对应的表达均值序列之间的差值确定。
16.进一步地,获取所述表达均值序列以及表达标准差序列,包括:
17.获取每个细胞系对应的原始表达均值序列以及原始表达标准差序列;
18.针对每个细胞系的每个表达维度,分别对原始表达均值以及原始表达标准差进行标准化处理,得到标准化后的表达均值序列以及表达标准差序列。
19.进一步地,所述药物信息包括:药物的结构特征信息,所述获取待测药物组合中每种药物的药物信息,包括:
20.获取待测药物组合中每种药物的smiles结构信息;
21.将所述smiles结构信息进行向量化处理,得到每种药物对应的结构特征信息。
22.进一步地,所述药物信息还包括:药物的副作用特征信息,所述获取待测药物组合中每种药物的药物信息,还包括:
23.获取所述待测药物组合中每种药物的副作用特征信息,所述副作用特征信息的维度基于预先构建的副作用信息库中包含的副作用种类数确定,所述副作用特征信息中每个维度对应一种副作用。
24.进一步地,基于所述药物信息、所述基因突变信息、所述降维后的表达特征序列以及预先训练的深度学习模型,确定所述待测药物组合对待检测的细胞系是否具有协同性,包括:
25.将每种药物的所述结构特征信息和所述副作用特征信息、以及每种细胞系的所述基因突变信息和降维后的表达特征序列进行水平拼接处理,得到输入特征向量;
26.将所述输入特征向量输入预先训练的深度学习模型,得到协同性预测结果,所述协同性预测结果用于表征所述待测药物组合对待检测的细胞系是否具有协同性。
27.第二方面,本技术实施例提供了一种药物组合协同性确定装置,包括:
28.获取模块,用于获取待测药物组合中每种药物的药物信息以及待检测的细胞系信息,所述细胞系信息包括:mrna的表达信息以及基因突变信息,所述表达信息包括:表达均值序列以及表达标准差序列;
29.表达特征提取模块,用于基于所述表达均值序列以及所述表达标准差序列,得到每个细胞系的初始表达特征序列,将所述初始表达特征序列输入预先训练的自编码器进行特征提取,得到降维后的表达特征序列;
30.确定模块,用于基于所述药物信息、所述基因突变信息、所述降维后的表达特征序列以及预先训练的深度学习模型,确定所述待测药物组合对待检测的细胞系是否具有协同性。
31.第三方面,本技术实施例提供了一种电子设备,所述电子设备包括:
32.一个或多个处理器;
33.存储器;
34.一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行上述第一方面所述的药物组合协同性确定方法。
35.第四方面,本技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的药物组合协同性确定方法。
36.本技术实施例提供的技术方案,至少具有如下技术效果或优点:
37.本技术实施例提供的药物组合协同性确定方法、装置、电子设备及介质,能够通过深度学习模型端到端地实现对待测药物组合的协同性进行预测,并且在对mrna的表达信息进行特征提取的过程中,融合了表达标准差数据,有利于丰富所提取的表达信息,提高表达特征提取的准确性,从而提高协同性预测结果的准确性,降低后续实验阶段的不必要损耗。
38.上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
附图说明
39.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
40.图1为本技术实施例中一种药物组合协同性确定方法的流程图;
41.图2为本技术实施例中一种示例性自编码器的网络架构图;
42.图3为本技术实施例中一种协同性预测流程示意图;
43.图4为本技术实施例中一种药物组合协同性确定装置的结构示意图;
44.图5为本技术实施例中一种电子设备的结构示意图。
具体实施方式
45.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本文中,术语“多个”包括两个或大于两个的情况。
46.本文中,mrna(messenger rna,信使核糖核酸),是一大类rna分子,它将遗传信息从dna传递到核糖体,在那里作为蛋白质合成模板并决定基因表达蛋白产物肽链的氨基酸序列。smiles(simplified molecular input line entry system,简化分子线性输入规范)是表示药物结构的线性表示法,里面使用字母,数字和特殊字符用来表示一个分子。例如,“c”代表碳原子,“=”表示两个原子之间的共价键,碳二氧化物可以表示为o=c=o,阿司匹林可以表示为o=c(c)oc1ccccc1c(=o)o,其中药物最长的smiles表达共有188位。
47.图1示出了本技术实施例提供的一种药物组合协同性确定方法的流程图。如图1所示,该药物组合协同性确定方法至少可以包括以下步骤s101至步骤s103。
48.步骤s101,获取待测药物组合中每种药物的药物信息以及待检测的细胞系信息,细胞系信息包括:mrna的表达信息以及基因突变信息,表达信息包括:表达均值序列以及表达标准差序列。
49.待测药物组合即为需要检测协同性的药物组合,可以包括两种或两种以上药物的组合。例如,待测药物组合可以为抗肿瘤药物组合。待检测的细胞系为待测药物组合能够作用的细胞的集合。例如,在肿瘤领域中,细胞系可以为多个肿瘤细胞的集合。从生物学的机理来分析,组合使用药物可以相互作用,对细胞系产生协同性效果,以杀死肿瘤细胞系。
50.在一些示例中,药物信息可以包括:药物对应的结构特征信息。此时,步骤s101中,获取待测药物组合中每种药物的药物信息的过程可以包括:获取待测药物组合中每种药物的smiles结构信息;将smiles结构信息进行向量化处理,得到每种药物对应的结构特征信息。将smiles结构信息进行向量化处理,作为输入特征之一,直接输入到深度学习模型中,得到协同性预测结果,有利于提高药物组合协同性的预测效率。
51.例如,药物的smiles结构信息可以从药物信息库如drugbank中获取。可以预先对药物信息库中所有具有smiles结构的药物进行embedding训练,得到每种药物smiles结构的向量表示。其中,向量表示维度可以根据实际需要设置,例如,可以设定向量转换模型的输出维度为6,则smiles结构中每个字母,数字和特殊字符均可以转换成一个6维向量,则药物smiles结构向量化后的格式是6*原结构长度。例如,向量转换模型可以采用词向量模型如word2vec等。
52.以阿司匹林的smiles结构信息o=c(c)oc1ccccc1c(=o)o为例,通过embedding训练,可以学习得到其中每个字符如“o”“=”“c”等对应的向量表达,从而得到整体结构的向量表达。
53.进一步地,除了结构特征信息以外,药物信息还可以包括:药物对应的副作用特征信息。此时,上述获取待测药物组合中每种药物的药物信息的过程还可以包括:获取待测药物组合中每种药物的副作用特征信息,副作用特征信息的维度基于预先构建的副作用信息库中包含的副作用种类数确定,副作用特征信息中每个维度对应一种副作用。
54.副作用信息库中存储有药物可能存在的多种副作用信息,这些副作用信息可以从已有相关数据库如sider4.1数据库获取。sider4.1数据库中药物的副作用信息以词组的方式呈现。为了简化处理过程,可以用0,1分别代表有、无该副作用,最后针对待测药物组合中的每种药物,分别生成由0和1组成的向量。例如,副作用信息库中有n种副作用,则副作用特征信息为n维向量。
55.除了药物结构信息、细胞系的基因突变信息以及表达信息以外,引入药物的副作用信息,有利于丰富深度学习模型的输入特征,使得模型能够学习到更多的药理层面的相关信息,从而提高协同性预测结果的准确性。
56.细胞系的基因突变信息属于细胞系基因组数据。例如,基因突变信息可以从gdsc数据库(genomics of drug sensitibity in cancer,抗癌药物敏感性基因组学数据库)获取,每个细胞系对应一个310维的基因突变向量,其中每个维度对应一种基因,维度值为“1”代表相应的基因有突变的情况,维度值为“0”代表无突变情况。例如,待检测的细胞系有100组,则对应100个基因突变向量。
57.在一些示例中,mrna的表达数据可以从affymetrix人类基因组u219阵列中获得。
e-mtab-3610数据集中除表达的均值外,还包含表达标准差数据。个体基因表达水平受表达的时间、空间特性及受干扰的影响,必定是一个动态的水平,因此利用标准差更能体现实际的生物学意义。也就是说,每个细胞系对应一个mrna表达均值序列以及一个mrna表达标准差序列。对于每个细胞系来讲,表达均值序列包括:m个维度的表达均值,表达标准差序列包括:m个维度的表达标准差,m个维度的表达均值与m个维度的表达标准差一一对应。
58.通常来讲,表达信息的维度能够达到上万维,即m值能够达到一万多,远大于基因突变信息以及药物信息的维度。因此,为了简化计算量,减少模型训练时间以及预测时间,可以通过执行以下步骤s102对表达信息进行特征压缩。
59.在一些示例中,各细胞系同一维度的表达信息可能存在较大的差异,为了增加模型收敛性,在对表达信息进行压缩之前,可以先对各细胞系的表达均值以及表达标准差进行标准化处理,例如,可以采用min-max标准化,将值映射到[0,1]之间。
[0060]
由此,步骤s101中,获取表达均值序列以及表达标准差序列的过程可以包括:获取每个细胞系对应的原始表达均值序列以及原始表达标准差序列;针对每个细胞系的每个表达维度,分别对原始表达均值以及原始表达标准差进行标准化处理,得到标准化后的表达均值序列以及表达标准差序列。
[0061]
以min-max标准化为例,对于表达均值的标准化:可以针对各细胞系对应的原始表达均值序列中的同一表达维度,比较各细胞系的原始表达均值大小,得到该表达维度下的最大表达均值x
max
和最小表达x
min
;然后,根据公式x norm
=(x-x
min
)/(x
max-x
min
),得到该表达维度下每个细胞系的标准化后的表达均值。其中,x表示原始表达均值,x norm
表示标准化后的表达均值。按照上述标准化过程分别对每个表达维度进行标准化处理,即可得到每个细胞系对应的标准化后的表达均值序列。
[0062]
对于表达标准差的标准化:可以针对各细胞系对应的原始表达标准差序列中的每个表达维度,根据公式σ
norm
=(σ/x)*x
norm
,得到标准化后的表达标准差。其中,σ
norm
表示标准化后的表达标准差,σ表示原始表达标准差。
[0063]
步骤s102,基于表达均值序列以及表达标准差序列,得到每个细胞系的初始表达特征序列,将初始表达特征序列输入预先训练的自编码器进行特征提取,得到降维后的表达特征序列。
[0064]
自编码器是通过无监督的方式来训练输入数据在较低维度的表达,如图2所示,主要由三部分组成:编码层(encoder):由一系列神经元个数逐步递减的layers构成;中间层(latent vector):代表可将输入的表达信息得到最大化保存的最低维度;解码层(decoder):编码架构的镜像,只不过每个layer的神经元个数是逐步递增的。例如,编码层的第一层layer包括2000个神经元,第二层和第三层分别为1000和500;解码层与之相反,第一层、第二层、第三层的神经元个数依次为500、1000和2000。
[0065]
本技术实施例在利用自编码器进行mrna的表达特征提取时,对自编码器的输入进行了优化,输入数据除了表达均值数据以外,还融合了表达标准差数据,有利于丰富所提取的表达信息,从而提高特征提取的准确性。
[0066]
在一些示例中,基于表达均值序列以及表达标准差序列,得到每个细胞系的初始表达特征序列的过程可以包括:分别针对每个细胞系的每个表达维度,基于预设的随机变量以及该表达维度的表达标准差,得到该表达维度的扰动量,并基于该表达维度的表达均
值以及扰动量,得到该表达维度的初始表达特征;进而,就可以基于每个细胞系的每个表达维度的初始表达特征,构成每个细胞系的初始表达特征序列。
[0067]
这样就可以在输入的表达均值数据中加入了小扰动,并且巧妙地将扰动量与表达标准差关联,既可以提升自编码器的泛化能力以及鲁棒性,又能够使得输入表达信息在表达均值的基础上融入了表达标准差,有效地丰富了进行特征提取的表达信息,提升了表达特征提取的准确性,从而有利于提高协同性预测结果的准确性。
[0068]
例如,对于每个细胞系的每个表达维度来讲,可以根据以下公式:
[0069][0070]
得到初始表达特征其中,b为预设的随机变量,b*σ
norm
为扰动量。
[0071]
在一些示例中,上述随机变量b可以为离散型随机变量,取值包括:0、1、-1,其中,取0的概率为p,取-1的概率为(1-p)/2,取1的概率为(1-p)/2,p为大于0且小于1的数,具体可以根据实际需要以及多次试验配置。由于单个细胞系的表达数据量在万级以上,通过该方法能保证预期
±
表达标准差的数量。
[0072]
在一些示例中,考虑到标准差数据的特殊性,即反应数据的离散程度,并不是1或者-1的情况。可以将随机变量b定义为一个符合0为均值,1为标准差的随机函数。此时,上述随机变量b为连续型随机变量,取值为-1到1。这样可以使得扰动量的变化更连续,扰动变化越多,有利于进一步提升自编码器的鲁棒性,从而提高表达特征提取的可靠性以及准确性。
[0073]
在自编码器的训练过程中,可以预先收集训练样本的表达均值数据和表达标准差数据,按照上述过程进行预处理,得到训练样本的初始表达特征序列,利用训练样本对自编码器进行训练。
[0074]
具体的,将初始表达特征序列中各初始表达特征输入自编码器中,经过编码层到达中间层,信号变为y,可以用如下公式表示:其中,s是非线性函数,如sigmoid函数,w是输入层到中间层的链接权值,b为中间层的偏置(bias)。y经过解码层解码,输出到输出层,信号变为z,如下公式:z=s(w'y b')。利用训练样本对w、w'、b、b'进行训练,直至预设损失函数值满足收敛条件,即可完成自编码器的训练。
[0075]
其中,预设损失函数值可以基于解码层的解码结果与输入编码层的初始表达特征序列对应的表达均值序列之间的差值确定。例如,自编码器的损失函数可以为:
[0076]
l(x0,z)=||x
0-z||2[0077]
其中,x0为未经扰动处理的表达均值,即上述的x
norm

[0078]
具体实施时,将待检测细胞系对应的初始表达特征序列输入训练好的自编码器,就可以得到由中间层输出的降维后的表达特征序列。该表达特征序列为能够初始表达特征序列中的信息得到最大化保存的最低维度,即在完成对高维表达信息的压缩的同时,尽可能从中提取出较准确的特征信息。
[0079]
步骤s103,基于药物信息、基因突变信息、降维后的表达特征序列以及预先训练的深度学习模型,确定待测药物组合对待检测的细胞系是否具有协同性。
[0080]
在执行步骤s103之前,需要先完成深度学习模型的训练,训练过程可以包括:构建初始深度学习模型,通过预先收集的样本数据对该初始深度学习模型进行训练,得到训练好的深度学习模型。深度学习模型的输入为:待测药物组合中每种药物的药物信息、待检测
细胞系的基因突变信息以及待检测细胞系中mrna的表达特征序列,输出为:协同性预测结果,用于表征预测待测药物组合对待检测的细胞系是否具有协同性。
[0081]
具体的,样本数据包括样本的输入特征数据以及分类标签。分类标签包括具有协同性和不具有协同性两种类别标签。例如,以抗肿瘤药物组合的协同性预测为例,可以收集目前已有的抗肿瘤药物组合作为训练样本,按照上述步骤s101和步骤s102对这些训练样本进行药物组合协同性预测相关数据的获取,得到样本的输入特征数据。根据这些药物组合的协同性数据确定其分类标签值。例如,药物的协同性通常要用一些参考模型来衡量,其中就包括了loewe模型。根据loewe评分的定义,真实评分大于阈值t视为强协同作用;小于阈值-t视为强拮抗作用;而基于两者之间则称为加性作用。在drugcomb数据集上,阈值t通常被设置为10。由此,可以得到作为训练样本的药物组合的协同性分类标签值,如可以用1表示具有协同性,0表示不具有协同性。
[0082]
初始深度学习模型的构建方式有多种。例如,可以采用全连接网络,或者,其他适用的深度学习模型,本实施例对此不做限制。以采用全连接网络为例,全连接网络的层数以及每层的神经元数量可以根据实际需要以及多次试验设置,需保证神经元数量逐层递减,且最后一层即输出层的神经元数量为1。
[0083]
例如,在一种应用场景中,全连接网络可以分为4层,分别有500,200,100,1个神经元。采用交叉熵损失作为损失(loss)函数进行训练,计算方法如下:
[0084][0085]
其中,l为损失函数值,n为样本数量,y

为预测值,y为真实值即样本对应的分类标签值(0或1)。例如,相关训练参数可以配置为:优化器使用随机梯度下降法(sgd),批量大小batch=32,dropout=0.001,迭代次数epoch=100。训练过程具体可以参照相关技术,本实施例对此不做详述。
[0086]
完成深度学习模型的训练后,就可以利用该深度学习模型来对待测药物组合进行协同性预测。具体的,可以将待测药物组合中每种药物的药物信息、待检测细胞系的基因突变信息以及待检测细胞系中mrna的表达特征序列进行拼接,得到输入特征向量。
[0087]
例如,对于每个细胞系来讲,经过自编码器降维后的表达特征序列的维度为:1*500,基因突变信息的维度为:1*310;对于待测药物组合中每种药物来讲,结构特征信息的维度为:6*结构长度,副作用特征信息的维度为:1*n。考虑到上述特征的维度大小比较接近,可以采用水平拼接的方式处理上述特征。也就是说,如图3所示,将每种药物的结构特征信息、每种药物的副作用特征信息、每种细胞系的基因突变信息、每种细胞系中mrna的表达特征序列进行水平拼接处理,得到上述输入特征向量。
[0088]
进一步,将输入特征向量输入深度学习模型,就可以端到端地输出协同性预测结果,从而确定待测药物组合对于待检测的细胞系是否具有协同性。
[0089]
本技术实施例提供的药物组合协同性确定方法,可以应用在实验阶段之前。通过采用本实施例的技术方案,可以检测任意药物组合对某些细胞系来讲是否具有协同作用,若具有协同性,可以进一步采用实验进行验证。这样可以避免所有联用的药物都直接进行实验,能够有效地降低实验损耗,提高实验效率。并且,在压缩mrna表达信息的过程中,融合了表达标准差数据,有利于丰富所提取的表达信息,提高表达特征提取的准确性,从而提高
协同性预测结果的准确性,有利于进一步降低实验损耗,节约实验成本以及实验周期。
[0090]
基于同一发明构思,本技术实施例还提供了一种药物组合协同性确定装置,如图4所示,该药物组合协同性确定装置40包括:
[0091]
获取模块401,用于获取待测药物组合中每种药物的药物信息以及待检测的细胞系信息,所述细胞系信息包括:mrna的表达信息以及基因突变信息,所述表达信息包括:表达均值序列以及表达标准差序列;
[0092]
表达特征提取模块402,用于基于所述表达均值序列以及所述表达标准差序列,得到每个细胞系的初始表达特征序列,将所述初始表达特征序列输入预先训练的自编码器进行特征提取,得到降维后的表达特征序列;
[0093]
确定模块403,用于基于所述药物信息、所述基因突变信息、所述降维后的表达特征序列以及预先训练的深度学习模型,确定所述待测药物组合对待检测的细胞系是否具有协同性。
[0094]
在一些示例中,上述表达特征提取模块402具体可以用于:
[0095]
分别针对每个细胞系的每个表达维度,基于预设的随机变量以及所述表达维度的表达标准差,得到所述表达维度的扰动量,并基于所述表达维度的表达均值以及所述扰动量,得到所述表达维度的初始表达特征;
[0096]
基于每个细胞系的每个表达维度的初始表达特征,构成每个细胞系的初始表达特征序列。
[0097]
在一些示例中,上述随机变量为离散型随机变量,所述随机变量的取值包括:0、1、-1,其中,所述随机变量取0的概率为p,所述随机变量取-1的概率为(1-p)/2,所述随机变量取1的概率为(1-p)/2,p为大于0且小于1的数。
[0098]
在一些示例中,所述随机变量为连续型随机变量,取值为-1到1,且所述随机变量取值满足均值为0,标准差为1的分布。
[0099]
在一些示例中,上述自编码器基于预设损失函数训练得到,所述自编码器包括编码层、中间层以及解码层。其中,所述中间层用于输出降维后的表达特征序列,所述预设损失函数的值基于所述解码层的解码结果与输入所述编码层的初始表达特征序列对应的表达均值序列之间的差值确定。
[0100]
在一些示例中,上述获取模块401具体可以用于:
[0101]
获取每个细胞系对应的原始表达均值序列以及原始表达标准差序列;
[0102]
针对每个细胞系的每个表达维度,分别对原始表达均值以及原始表达标准差进行标准化处理,得到标准化后的表达均值序列以及表达标准差序列。
[0103]
在一些示例中,药物信息包括:药物的结构特征信息。上述获取模块401具体可以用于:
[0104]
获取待测药物组合中每种药物的smiles结构信息;
[0105]
将所述smiles结构信息进行向量化处理,得到每种药物对应的结构特征信息。
[0106]
在一些示例中,药物信息还包括:药物的副作用特征信息,上述获取模块401具体可以用于:
[0107]
获取所述待测药物组合中每种药物的副作用特征信息,所述副作用特征信息的维度基于预先构建的副作用信息库中包含的副作用种类数确定,所述副作用特征信息中每个
维度对应一种副作用。
[0108]
在一些示例中,上述确定模块403具体用于:
[0109]
将每种药物的所述结构特征信息和所述副作用特征信息、以及每种细胞系的所述基因突变信息和降维后的表达特征序列进行水平拼接处理,得到输入特征向量;
[0110]
将所述输入特征向量输入预先训练的深度学习模型,得到协同性预测结果,所述协同性预测结果用于表征所述待测药物组合对待检测的细胞系是否具有协同性。
[0111]
需要说明的是,本技术实施例所提供的药物组合协同性确定装置40,其中各个模块执行操作的具体方式已经在上述第一方面提供的方法实施例中进行了详细描述,具体实施过程可以参照上述第一方面提供的方法实施例,此处将不做详细阐述说明。
[0112]
基于同一发明构思,如图5所示,本技术实施例还提供了一种电子设备,包括一个或多个处理器502、存储器504及存储在存储器504上并可在处理器502上运行的一个或多个应用程序(图中未示出)。该一个或多个程序配置用于实现上述第一方面提供的药物组合协同性确定方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0113]
需要说明的是,电子设备可以是任意具有数据处理功能的设备,本实施例对此不做限定。例如,电子设备可以是个人电脑、手机、平板电脑、笔记本电脑、智能穿戴设备等用户终端,或者,也可以是服务器。
[0114]
在图5中,总线架构(用总线500来代表),总线500可以包括任意数量的互联的总线和桥,总线500将包括由处理器502代表的一个或多个处理器和存储器504代表的存储器的各种电路链接在一起。总线500还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口505在总线500和接收器501和发送器503之间提供接口。接收器501和发送器503可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器502负责管理总线500和通常的处理,而存储器504可以被用于存储处理器502在执行操作时所使用的数据。
[0115]
可以理解的是,图5所示的结构仅为示意,本技术实施例提供的电子设备还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件、软件或其组合实现。
[0116]
基于同一发明构思,本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行上述第一方面提供的药物组合协同性确定方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。举例来讲,该计算机可读存储介质可以是只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等。
[0117]
本领域内的技术人员应明白,本技术的实施例可提供为方法、装置、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0118]
本技术是参照根据本技术实施例的方法、装置、和计算机程序产品的流程图和/或
方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0119]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0120]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0121]
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0122]
尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献