一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

药物重定位方法、重定位模型的训练方法及装置与流程

2022-10-21 20:58:48 来源:中国专利 TAG:


1.本公开涉及人工智能技术领域中的深度学习和生物计算技术领域,尤其涉及一种药物重定位方法、重定位模型的训练方法及装置。


背景技术:

2.药物重定位可应用于针对已存在的药物寻找新的适应症的场景中,在生物医药产业中,药物具有发现困难,审批周期长等特点,如果能够发现已审批药物的新用途则可以缩短审批周期,扩大药企的市场容量同时也造福于患者。目前可以通过预测药物对某一细胞系的组学表征的响应程度(如:ic50值),寻找药物新的潜在适应症,因此如何提高预测准确度,增强药物重定位的准确度成为亟待解决的问题。


技术实现要素:

3.提供了一种药物重定位方法、重定位模型的训练方法及装置。
4.根据第一方面,提供了一种药物重定位方法,包括:获取药物分子和细胞组学数据;获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示;对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,所述预测向量矩阵用于表征所述药物分子与所述细胞组学数据之间的相互作用关系;根据所述预测向量矩阵和所述第一向量表示,对所述药物分子进行重定位。
5.根据第二方面,提供了一种基于重定位模型的药物重定位方法,包括:获取药物分子和细胞组学数据,并将所述药物分子和所述细胞组学数据输入训练后的目标重定位模型;由所述目标重定位模型中的编码网络,获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示;由所述目标重定位模型中的多头注意力网络,对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,所述预测向量矩阵用于表征所述药物分子与所述组学数据之间的相互作用关系;由所述目标重定位模型中的预测网络,根据所述预测向量矩阵和所述第一向量表示,对所述药物分子进行重定位。
6.根据第三方面,提供了一种重定位模型的训练方法,包括:从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分子和同一细胞系的组学数据对应的样本,作为训练样本,其中所述训练集中还包括所述药物分子和所述组学数据之间的响应参数的真实值;根据所述训练样本,对待训练的重定位模型进行训练;根据训练输出的所述响应参数的预测值和所述响应参数的真实值,调整所述重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。
7.根据第四方面,提供了一种药物重定位装置,包括:第一获取模块,用于获取药物分子和细胞组学数据;第二获取模块,用于获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示;第三获取模块,用于对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,所述预测向量矩阵用于表征所述药物分子与所述细胞组学数据之间的相互作用关系;预测模块,用于根据所述预测向量矩阵和所
述第一向量表示,对所述药物分子进行重定位。
8.根据第五方面,一种基于重定位模型的药物重定位装置,包括:第一获取模块,获取药物分子和细胞组学数据,并将所述药物分子和所述细胞组学数据输入训练后的目标重定位模型;第二获取模块,用于由所述目标重定位模型中的编码网络,获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示;第三获取模块,用于由所述目标重定位模型中的多头注意力网络,对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,所述预测向量矩阵用于表征所述药物分子与所述组学数据之间的相互作用关系;预测模块,用于由所述目标重定位模型中的预测网络,根据所述预测向量矩阵和所述第一向量表示,对所述药物分子进行重定位。
9.根据第六方面,提供了一种重定位模型的训练装置,包括:获取模块,用于从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分子和同一细胞系的组学数据对应的样本,作为训练样本,其中所述训练集中还包括所述药物分子和所述组学数据之间的响应参数的真实值;训练模块,用于根据所述训练样本,对待训练的重定位模型进行训练;更新模块,用于根据训练输出的所述响应参数的预测值和所述响应参数的真实值,调整所述重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。
10.根据第七方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开第一方面所述的药物重定位方法,或者本公开第二方面所述的基于重定位模型的药物重定位方法,或者本公开第三方面所述的重定位模型的训练方法。
11.根据第八方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开第一方面所述的药物重定位方法,或者本公开第二方面所述的基于重定位模型的药物重定位方法,或者本公开第三方面所述的重定位模型的训练方法。
12.根据第九方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开第一方面所述的药物重定位方法的步骤,或者本公开第二方面所述的基于重定位模型的药物重定位方法的步骤,或者本公开第三方面所述的重定位模型的训练方法的步骤。
13.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
14.附图用于更好地理解本方案,不构成对本公开的限定。其中:
15.图1是根据本公开第一实施例的药物重定位方法的流程示意图;
16.图2是根据本公开第二实施例的药物重定位方法的流程示意图;
17.图3是根据本公开第三实施例的药物重定位方法的流程示意图;
18.图4是根据本公开第四实施例的药物重定位方法的流程示意图;
19.图5是根据本公开第五实施例的药物重定位方法的流程示意图;
20.图6是根据本公开第一实施例的基于重定位模型的药物重定位方法的流程示意图;
21.图7是根据本公开第二实施例的基于重定位模型的药物重定位方法的流程示意图;
22.图8是根据本公开实施例的基于重定位模型的药物重定位方法的示例性框图;
23.图9是根据本公开第一实施例的重定位模型的训练方法的流程示意图;
24.图10是根据本公开实施例的重定位模型的训练方法中的交叉采样示意图;
25.图11是根据本公开第二实施例的重定位模型的训练方法的流程示意图;
26.图12是对训练好的重定位模型进行效果验证的结果示意图;
27.图13是根据本公开第一实施例的药物重定位装置的框图;
28.图14是根据本公开第二实施例的药物重定位装置的框图;
29.图15是根据本公开第一实施例的基于重定位模型的药物重定位装置的框图;
30.图16是根据本公开第二实施例的基于重定位模型的药物重定位装置的框图;
31.图17是根据本公开第一实施例的重定位模型的训练装置的框图;
32.图18是根据本公开第二实施例的重定位模型的训练装置的框图;
33.图19是用来实现本公开实施例的方法的电子设备的框图。
具体实施方式
34.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
35.人工智能(artificialintelligence,简称ai)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。目前,ai技术具有自动化程度高、精确度高、成本低的优点,得到了广泛的应用。
36.深度学习(deep learning,简称dl),是机器学习(machine learning,简称ml)领域中一个新的研究方向,学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。就具体研究内容而言,主要包括基于卷积运算的神经网络系统,即卷积神经网络;基于多层神经元的自编码神经网络;以多层自编码神经网络的方式进行预训练,进而结合鉴别信息进一步优化神经网络权值的深度置信网络。深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。
37.生物计算是指利用生物系统固有的信息处理机理而研究开发的一种新的计算模式。生物计算机可以理解为由生物组件组成的超级计算机,可以执行计算任务,如数据存储和逻辑运算。生物计算主要分为3种类型:蛋白质计算、rna计算和dna计算。例如存在于我们的身体中的生物计算:dna储存着人类的核心遗传信息、rna输入数据、核糖体进行逻辑运算
等。
38.下面结合附图描述本公开实施例的药物重定位方法、重定位模型的训练方法及装置。
39.图1是根据本公开第一实施例的药物重定位方法的流程示意图。
40.如图1所示,本公开实施例的药物重定位方法具体可包括以下步骤:
41.s101,获取药物分子和细胞组学数据。
42.具体的,本公开实施例的药物重定位方法的执行主体可为本公开实施例提供的药物重定位装置,该药物重定位装置可为具有数据信息处理能力的硬件设备和/或驱动该硬件设备工作所需必要的软件。可选的,执行主体可包括工作站、服务器,计算机、用户终端及其他设备。
43.在本公开实施例中,获取待进行重定位的药物分子以及预选择的某种病症对应的细胞组学数据,例如可以为癌症细胞的转录组学数据、基因组学数据和表观遗传组学数据等,本公开实施例中的细胞组学数据可以为单组学数据或多组学数据。
44.s102,获取药物分子的第一向量表示和细胞组学数据的第二向量表示。
45.在本公开实施例中,分别对药物分子和某种疾病的细胞组学数据进行特征提取,得到各自的向量表示,即药物分子的第一向量表示和细胞组学数据的第二向量表示。
46.s103,对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系。
47.在本公开实施例中,基于多头注意力机制捕获药物分子与细胞组学数据之间的关系,如两者之间的相互作用。
48.对药物分子的第一向量表示和细胞组学数据的第二向量表示进行多头的注意力计算,最终得到两者之间的预测向量矩阵,该矩阵可用于表征药物分子与细胞组学数据之间的相互作用关系。
49.s104,根据预测向量矩阵和第一向量表示,对药物分子进行重定位。
50.在本公开实施例中,第一向量表示可以表征药物分子的结构等特征,预测向量矩阵可以表征药物分子与细胞组学之间的互作用,可以基于预测向量矩阵和第一向量表示,预测药物分子对上述疾病细胞的响应程度,以此判断该药物分子是否可应用于治疗该疾病,以此实现药物重定位。
51.综上,本公开实施例的药物重定位方法,获取药物分子和细胞组学数据;获取药物分子的第一向量表示和细胞组学数据的第二向量表示;对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系;根据预测向量矩阵和第一向量表示,对药物分子进行重定位。基于多头注意力机制捕获药物分子中子结构与细胞组学数据之间的关系,提高了预测准确度,增强重定位准确度。
52.图2是根据本公开第二实施例的药物重定位方法的流程示意图。
53.如图2所示,在图1所示实施例的基础上,本公开实施例的药物重定位方法具体可包括以下步骤:
54.s201,获取药物分子和细胞组学数据。
55.s202,获取药物分子的第一向量表示和细胞组学数据的第二向量表示。
56.s203,根据第一向量表示,确定多头注意力处理对应的查询向量矩阵。
57.在本公开实施例中,根据药物分子的第一向量表示构建多头注意力机制的一个输入矩阵即查询向量(queryvector)矩阵q。
58.将第一向量表示对应的矩阵x乘以权重矩阵w
iq
,得到第i个注意力头对应的查询矩阵qi,以此分别得到h个注意力头的查询向量矩阵,其中,i=1,2,
……
,h。
59.s204,根据第二向量表示,确定多头注意力处理对应的键向量矩阵和值向量矩阵。
60.在本公开实施例中,根据细胞组学数据的第二向量表示构建多头注意力机制的另两个输入矩阵即键向量(key vector)矩阵k,和值向量(value vector)矩阵v。
61.将第二向量表示对应的矩阵r乘以权重矩阵w
ik
,得到第i个注意力对应的键矩阵ki,以此分别得到h头注意力的键矩阵。
62.将第二向量表示对应的矩阵r乘以权重矩阵w
iv
,得到第i个注意力头对应的值向量矩阵vi,以此分别得到h个注意力头的值向量矩阵。
63.其中权重矩阵w
iq
、w
ik
和w
iv
可以通过预先设置或预先训练得到。
64.在一些实施例中,上述根据第一向量表示确定查询向量矩阵,根据第二向量表示确定键向量矩阵和值向量矩阵的过程,可以通过线性层映射实现。
65.s205,根据查询向量矩阵、键向量矩阵和值向量矩阵进行多头注意力处理,以获取预测向量矩阵。
66.在本公开实施例中,基于下列计算公式,分别根据查询向量矩阵qi、键向量矩阵ki和值向量矩阵vi计算第i个注意力头hi。
[0067][0068]
其中,softmax()为一种激活函数,dk为键向量矩阵中一个键向量的维度,k
t
为键向量矩阵的转置。
[0069]
将h个注意力头的结果拼接或堆叠后经过线性层得到多头注意力最终的输出结果,可基于以下公式实现:
[0070]
mha(q,k,v)=concatenation(h1,h2,
……hh
)wo[0071]
其中,concatenation()为一种拼接函数,用于将h个注意力头的结果进行堆叠,wo为需要预先设置或训练的权重矩阵。
[0072]
mha(q,k,v)和第一向量表示对应的矩阵x经过add&norm层和前馈网络处理后的结果作为上述预测向量矩阵,其中add表示残差连接(residual connection),用于防止网络退化,norm表示(layer normalization),用于对每一层的激活值进行归一化。
[0073]
s206,根据预测向量矩阵和第一向量表示,对药物分子进行重定位。
[0074]
具体的,步骤s201-s202与上述步骤s101-s102相同,步骤s206与上述步骤s104相同,此处不再赘述。
[0075]
在上述实施例的基础上,如图3所示,本公开实施例还包括第一向量表示的获取过程,可包括以下步骤:
[0076]
s301,根据药物分子的结构信息,生成药物分子对应的图,其中,图中的节点对应于药物分子中的原子,边对应于药物分子中的化学键。
[0077]
在一些实施例中可以根据药物分子的化学式确定药物分子的结构信息,确定其中
原子之间的连接关系,基于药物分子的结构信息生成对应的图,图中每个节点对应一个原子,节点间的边对应原子间的化学键。
[0078]
s302,基于图神经网络对药物分子对应的图进行编码,以获取节点的向量表示作为第一向量表示。
[0079]
将药物分子对应的图输入图神经网络对图中节点进行编码,即提取节点的特征,得到每个节点的向量表示,以此实现对药物分子的结构等特征的提取。
[0080]
在上述实施例的基础上,如图4所示,本公开实施例还包括第二向量表示的获取过程,可包括以下步骤:
[0081]
s401,根据细胞组学数据中基因之间的关系构建所述细胞组学数据对应的图,其中,所述图中的节点对应于所述基因,所述图中的边用于表征所述基因之间的关系。
[0082]
在本公开实施例中可以基于蛋白互作网络(ppi)确定细胞组学数据中基因之间的关系,构建细胞组学数据对应的图,如互作网络图,图中的节点对应于基因,图中的边用于表征基因之间的关系。
[0083]
s402,基于图神经网络对细胞组学数据对应的图进行编码,以获取细胞组学数据的向量表示。
[0084]
将细胞组学数据对应的图输入图神经网络,对图进行编码,以提取细胞组学数据的特征,如基因组、转录组和甲基化等对应的特征,作为细胞组学数据的向量表示。
[0085]
s403,基于多层感知网络对细胞组学数据的向量表示进行多层感知处理,以获取细胞组学数据的第二向量表示。
[0086]
在本公开实施例中,将细胞组学数据的向量表示输入多层感知网络如多层感知器mlp,将输出的一组向量表示作为细胞组学数据的第二向量表示。
[0087]
在一些实施例中,还可以通过卷积神经网络和全连接网络提取细胞组学数据的特征,得到第二向量表示,或者直接将组学数据通过多层感知器进行编码。
[0088]
在上述实施例的基础上,如图5所示,上述步骤s206中“根据预测向量矩阵和第一向量表示,对药物分子进行重定位”,可包括以下步骤:
[0089]
s501,对药物分子的第一向量表示进行全局池化处理,以生成药物分子的向量矩阵。
[0090]
在本公开实施例中,对药物分子的第一向量表示进行全局池化(global pooling),以得到表征药物分子整体特征的向量矩阵。
[0091]
s502,根据预测向量矩阵与药物分子的向量矩阵,获取药物分子与细胞组学数据之间的响应参数的预测值。
[0092]
在本公开实施例中,将预测向量矩阵和药物分子的向量矩阵堆叠后,经过多层感知器对药物分子和细胞组学数据之间的响应参数进行预测,响应参数可以为ic50,ic50值可以用来衡量药物诱导疾病细胞凋亡的能力。
[0093]
s503,根据预测值,对药物分子进行重定位。
[0094]
在本公开实施例中,可以根据ic50的预测值判断该药物分子对参与重定位的疾病细胞的响应程度,以此判断该药物分子是否可以使用于治疗该疾病细胞对应的病症,实现药物重定位。当我们不同疾病(癌症)的细胞系的组学数据作为输入,对于同一药物分子我们可以得到其在不同疾病细胞系的ic50预测值,从而可以发现已有药物的新用途。
[0095]
综上,本公开实施例的药物重定位方法,获取药物分子和细胞组学数据;获取药物分子的第一向量表示和细胞组学数据的第二向量表示;对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系;根据预测向量矩阵和第一向量表示,对药物分子进行重定位。基于多头注意力机制学习到药物分子中不同子结构的生物功能差异性,捕获药物分子中子结构与细胞组学数据之间的关系,从而更好的预测药物分子在细胞系上作用结果,提高了预测准确度,增强重定位准确度。
[0096]
可以通过构建深度学习模型作为重定位模型来实现上述药物重定位过程。
[0097]
图6是根据本公开第一实施例的基于重定位模型的药物重定位的流程示意图。
[0098]
如图6所示,本公开实施例的基于重定位模型的药物重定位方法具体可包括以下步骤:
[0099]
s601,获取药物分子和细胞组学数据,并将药物分子和细胞组学数据输入训练后的目标重定位模型。
[0100]
具体的,本公开实施例的基于重定位模型的药物重定位方法的执行主体可为本公开实施例提供的基于重定位模型的药物重定位装置,该基于重定位模型的药物重定位装置可为具有数据信息处理能力的硬件设备和/或驱动该硬件设备工作所需必要的软件。可选的,执行主体可包括工作站、服务器,计算机、用户终端及其他设备。
[0101]
在本公开实施例中,将获取的待重定位药物分子和预选择的某种疾病的细胞组学数据,输入经过训练的目标重定位模型中,以基于目标重定位模型对待重定位的药物分子进行重定位。
[0102]
在本公开实施例中,目标重定位模型可以包括但不限于编码网络和多头注意力网络。
[0103]
s602,由目标重定位模型中的编码网络,获取药物分子的第一向量表示和细胞组学数据的第二向量表示。
[0104]
在本公开实施例中,基于编码网络提取药物分子和细胞组学数据对应的特征,以获取药物分子的第一向量表示和细胞组学数据的第二向量表示。
[0105]
s603,由目标重定位模型中的多头注意力网络,对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系。
[0106]
本公开实施例基于多头注意力机制构建多头注意力网络,基于多头注意力机制提取第一向量表示和第二向量表示之间的关系,以便获取用于表征药物分子与细胞组学数据之间的相互作用关系的预测向量矩阵。
[0107]
s604,由目标重定位模型中的预测网络,根据预测向量矩阵和第一向量表示,对药物分子进行重定位。
[0108]
在本公开实施例中,重定位模型还可以包括预测网络,该预测网络用于根据预测向量矩阵和第一向量表示,预测药物分子对该疾病细胞的响应程度,以此判断该药物分子是否可应用于治疗该疾病,以此实现药物重定位。
[0109]
需要说明的是,上述对药物重定位方法实施例的解释说明,也适用于本公开实施例的基于重定位模型的药物重定位方法,具体过程此处不再赘述。
[0110]
综上,本公开实施例的基于重定位模型的药物重定位方法,获取药物分子和细胞组学数据,并将药物分子和细胞组学数据输入训练后的目标重定位模型;由目标重定位模型中的编码网络,获取药物分子的第一向量表示和细胞组学数据的第二向量表示;由目标重定位模型中的多头注意力网络,对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系;由目标重定位模型中的预测网络,根据预测向量矩阵和第一向量表示,对药物分子进行重定位。使用多头注意力机制对药物分子与细胞组学数据进行建模,同时通过图神经网络提取药物分子特征,结合图神经网络和多层感知提取细胞组学数据的特征,可适用于多种类型的药物分子,增强模型的通用性,通过多头注意力机制学习药物分子中子结构与细胞组学数据之间的关系,基于训练好的目标重定位模型进行药物分子重定位,提高了预测准确度,增强重定位准确度。
[0111]
图7是根据本公开第二实施例的基于重定位模型的药物重定位方法的流程示意图。
[0112]
如图7所示,在图6所示实施例的基础上,本公开实施例的重定位模型的药物重定位方法具体可包括以下步骤:
[0113]
s701,获取药物分子和细胞组学数据,并将药物分子和细胞组学数据输入训练后的目标重定位模型。
[0114]
s702,由目标重定位模型中的编码网络,获取药物分子的第一向量表示和细胞组学数据的第二向量表示。
[0115]
s703,分别由多个线性层根据第一向量表示,确定多头注意力处理对应的查询向量矩阵,以及根据第二向量表示,确定多头注意力处理对应的键向量矩阵和值向量矩阵。
[0116]
在本公开实施例中,上述多头注意力网络可以包括但不限于多个线性层和对应的多个注意力层。线性层与注意力层相对应,即第i个注意力层对应的线性层用于根据权重矩阵w
iq
对第一向量表示对应的矩阵x进行映射,得到第一i个注意力层对应的一个输入矩阵即查询向量矩阵q,其中i=1,2,
……
,h;以及根据权重矩阵w
ik
对第二向量表示对应的矩阵r进行映射,得到第一i个注意力层对应的另一个输入矩阵即键向量矩阵k;以及
[0117]
根据权重矩阵w
iv
对第二向量表示对应的矩阵r进行映射,得到第一i个注意力层对应的另一个输入矩阵即值向量矩阵v。
[0118]
其中权重矩阵w
iq
、w
ik
和w
iv
可以通过预先设置或预先训练得到。
[0119]
具体过程与上述实施例相同此处不再赘述。
[0120]
s704,由多个注意力层根据查询向量矩阵、键向量矩阵和值向量矩阵进行多头注意力处理,以获取预测向量矩阵。
[0121]
将获取到的每一个注意力层对应的查询向量矩阵、键向量矩阵和值向量矩阵输入注意力层,得到每层输出的注意力头,将h个注意力头的结果拼接或堆叠后经过注意力计算之后的线性层得到多头注意力最终的输出结果mha(q,k,v)。
[0122]
在本公开实施例中,重定位模型中还可以包括add&norm层和前馈网络,mha(q,k,v)和第一向量表示对应的矩阵x经过add&norm层和前馈网络处理后的结果作为上述预测向量矩阵。
[0123]
具体过程与上述实施例相同,此处不再赘述。
[0124]
s705,由目标重定位模型中的预测网络,根据预测向量矩阵和第一向量表示,对药物分子进行重定位。
[0125]
具体的,步骤s701-s702与上述步骤s601-s602相同,步骤s705与上述步骤s604相同,此处不再赘述。
[0126]
在上述实施例的基础上,本公开实施例在由目标重定位模型中的编码网络,获取药物分子的第一向量表示之前,根据药物分子的结构信息,生成药物分子对应的图,其中,图中的节点对应于药物分子中的原子,边对应于药物分子中的化学键。
[0127]
在上述实施例的基础上,目标重定位模型中的编码网络中包括图神经网络用于对药物分子进行特征提取。
[0128]
基于图神经网络对药物分子对应的图进行编码,以获取节点的向量表示作为第一向量表示。
[0129]
在上述实施例的基础上,本公开实施例在由目标重定位模型中的编码网络,获取细胞组学数据的第二向量表示之前,还包括:根据细胞组学数据中基因之间的关系构建细胞组学数据对应的图其中,图中的节点对应于基因,图中的边用于表征基因之间的关系
[0130]
在上述实施例的基础上,目标重定位模型中的编码网络可以包括图神经网络和多层感知网络用于对细胞组学数据进行特征提取,基于图神经网络对细胞组学数据对应的图进行编码,以获取细胞组学数据的向量表示;基于多层感知网络对细胞组学数据的向量表示进行多层感知处理,以获取细胞组学数据的第二向量表示。
[0131]
在一些实施例中,还可以在目标重定位模型中增加卷积神经网络,将细胞组学数据直接输入卷积神经网络进行编码,或者在目标重定位模型中添加多层感知网络即多层感知器或多层感知层,将细胞组学数据直接通过多层感知器进行编码。
[0132]
在上述实施例的基础上,预测网络包括池化层、拼接层和多层感知层,由目标重定位模型中的预测网络,根据预测向量矩阵和第一向量表示,对药物分子进行重定位,包括:
[0133]
由池化层对药物分子的第一向量表示进行全局池化处理,以生成药物分子的向量矩阵;由拼接层对预测向量矩阵和药物分子的向量矩阵进行堆叠处理,以生成待处理矩阵;由多层感知层,根据待处理矩阵,获取药物分子与细胞组学数据之间的响应参数的预测值,并根据预测值,对药物分子进行重定位。
[0134]
需要说明的是,上述对药物重定位方法实施例的解释说明,也适用于本公开实施例的基于重定位模型的药物重定位方法,具体过程此处不再赘述。
[0135]
综上,本公开实施例的基于重定位模型的药物重定位方法,获取药物分子和细胞组学数据,并将药物分子和细胞组学数据输入训练后的目标重定位模型;由目标重定位模型中的编码网络,获取药物分子的第一向量表示和细胞组学数据的第二向量表示;由目标重定位模型中的多头注意力网络,对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系;由目标重定位模型中的预测网络,根据预测向量矩阵和第一向量表示,对药物分子进行重定位。使用多头注意力机制对药物分子与细胞组学数据进行建模,同时通过图神经网络提取药物分子特征,结合图神经网络和多层感知提取组学数据的特征,可适用于多种类型的药物分子,增强模型的通用性,通过多头注意力机制学习药物分子中不同子结构的生物功能差异性及药物分子中子结构与细胞组学数据之间的关系,从而更好的预测药物
分子在细胞系上作用结果,基于训练好的目标重定位模型进行药物分子重定位提高了预测准确度,增强重定位准确度。
[0136]
为详细描述本公开实施例的基于重定位模型的药物重定位方法,现结合图8进行详细描述,如图8所示,对药物分子进行图构建,将药物分子对应的图输入图神经网络得到第一向量表示,将构建好的多组学数据的图输入图神经网络将提取到的特征,提取到的特征输入多层感知层以获取多组学数据的第二向量表示,将第一向量表示和第二向量表示经过拼接层堆叠后输入多头注意力网络获取药物分子的子结构与多个组学数据之间的注意力,将多头注意力网络最终的输出结果和第一向量表示对应的矩阵经过残差&归一化(add&norm)层和前馈网络得到预测向量矩阵,将预测向量矩阵与将全部的第一向量表示经过全局池化后得到的向量矩阵,进行堆叠后输入多层感知层mlp得到响应参数ic50的预测值,以便根据预测值对药物分子进行重定位。
[0137]
图9是根据本公开第一实施例的重定位模型的训练方法的流程示意图。
[0138]
如图9所示,本公开实施例的重定位模型的训练方法具体可包括以下步骤:
[0139]
s901,从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分子和同一细胞系的组学数据对应的样本,作为训练样本,其中训练集中还包括药物分子和组学数据之间的响应参数的真实值。
[0140]
具体的,本公开实施例的重定位模型的训练方法的执行主体可为本公开实施例提供的重定位模型的训练装置,该重定位模型的训练装置可为具有数据信息处理能力的硬件设备和/或驱动该硬件设备工作所需必要的软件。可选的,执行主体可包括工作站、服务器,计算机、用户终端及其他设备。
[0141]
在本公开实施例中,以不同细胞系的组学数据和不同的药物分子构建训练集、测试集和验证集,以一个细胞系对应的组学数据与一种药物分子为组合构建一个样本,将该组学数据与该药物分子对应的响应参数如ic50的值作为样本标签。
[0142]
为了让模型更加关注于实际应用场景中更加关注的同一药物在不同细胞系情况下的效果和不同药物在同一细胞系上的药物响应程度。如图10所示,本公开实施例使用交叉采样的方式从训练集中获取同一药物分子分别和不同细胞系的组学数据组成的样本以及不同药物分子和同一细胞系的组学数据组成的样本,以这两种类型的样本构成单批训练样本,以此获取模型训练过程中使用的多批训练样本。
[0143]
s902,根据训练样本,对待训练的重定位模型进行训练。
[0144]
在本公开实施例中,根据上述多批训练样本对待训练的重定位模型进行多轮训练。包括对重定位模型中包括的多头注意力层、线性层、多层感知层、池化层等结构的模型参数进行训练。
[0145]
s903,根据响应参数的真实值和训练过程中输出的响应参数的预测值,调整重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。
[0146]
在本公开实施例中,根据训练过程中模型输出的响应参数的预测值以及训练集中响应参数的真实值,对重定位模型的模型参数进行调整,以使得真实值收敛于预测值。在参数调整后继续使用下一个训练样本,如下一轮的多批训练样本,对调整后的重定位模型训练,直至得到训练好的目标重定位模型。其中参数调整可以基于梯度下降法sgd等优化方法
对模型参数进行优化。
[0147]
综上,本公开实施例的重定位模型的训练方法,从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分子和同一细胞系的组学数据对应的样本,作为训练样本,其中训练集中还包括药物分子和组学数据之间的响应参数的真实值;根据训练样本,对待训练的重定位模型进行训练;根据训练输出的响应参数的预测值和响应参数的真实值,调整重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。基于交叉采样获取训练样本,训练模型收敛,以使模型在训练种学习药物分子中子结构与细胞组学数据之间的关系,学习同一药物在不同细胞系情况下的响应程度和不同药物在同一细胞系上的药物响应程度,通过训练增强模型对药物分子和组学数据之间响应参数预测的准确度,以增强重定位准确度。
[0148]
图11是根据本公开第二实施例的重定位模型的训练方法的流程示意图。
[0149]
如图11所示,在图9所示实施例的基础上,本公开实施例的重定位模型的训练方法具体可包括以下步骤:
[0150]
s1101,从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分子和同一细胞系的组学数据对应的样本,作为训练样本,其中训练集中还包括药物分子和组学数据之间的响应参数的真实值。
[0151]
s1102,根据训练样本,对待训练的重定位模型进行训练。
[0152]
s1103,根据响应参数的真实值和训练过程中输出的响应参数的预测值,确定排序损失函数值和回归损失函数值。
[0153]
在本公开实施例中,使用排序损失函数和回归损失函数来约束模型,如下列公式所示:
[0154][0155][0156]
其中,l
rank
为排序损失函数,yn为第n个样本的响应参数的真实值,为第n个样本的响应参数的预测值,ym为第m个样本的响应参数的真实值,为第m个样本的响应参数的预测值,distance(yn,ym)表示yn和ym之间距离,margin为可设置的偏移量。
[0157]
s1104,根据排序损失函数值和回归损失函数值,确定模型训练的损失函数值。
[0158]
基于预设权重,对排序损失函数值和回归损失函数值求和,得到模型训练的损失函数值,如下列公式所示:
[0159]
l=β*l
mse
(1-β)*l
rank
[0160]
其中,β为模型的超参数,l
mse
为回归损失函数,l为模型训练的损失函数,上述预设权重可以根据超参数β确定。
[0161]
s1105,根据损失函数值调整重定位模型的模型参数,以继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。
[0162]
可以使用sgd或者其他优化器最小化损失函数l以在最终模型收敛后得到训练好的模型参数。
[0163]
具体的,步骤s1101-s1102与上述步骤s901-s902相同此处不再赘述。
[0164]
举例说明,通过癌症相关药物敏感性基因组学(genomics of drug sensitivity in cancer,简称gdsc)数据库和癌细胞系百科全书(cancer cell line encyclopedia,简称ccle)构建模型训练集,模型的输入为细胞系与药物对(即细胞系的组学数据和药物分子组成的样本),模型输出为ic50的预测值。通过收集癌症基因组图谱(the cancer genome atlas,简称tcga)数据库中药物顺铂(cisplatin)在不同患者中的用药数据及患者的多组学数据,构建验证集。
[0165]
使用待训练的重定位模型在训练集上进行训练,设置β=0.9,批大小=256等超参数。使用训练完成的模型,在验证集上进行预测验证,预测细胞系与药物对(如cisplatin与患者转录组学对)的用药效果即响应参数。我们使用不同的模型进行了验证,结果如图12所示,参与验证地模型包括弹性网络(elastic net)、随机森林模型rf、一种混合图卷积网络deepcdr和根据本公开的训练方法训练好的深度学习模型tcr。其中,效应量(effect-size)与

log(p_value)均为ic50预测值与ic50真实值的度量指标,其值越大越好,p_value对应于一种假设检验方法中的假定值或假设机率,即在给定原假设为真的前提下样本结果出现的概率。基于如12所示的预测结果,可得出药物cisplatin在适应症外的其他疾病患者身上预测结果也很好,则药物cisplatin具有潜在治疗此种疾病的能力。
[0166]
综上,本公开实施例的重定位模型的训练方法,从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分子和同一细胞系的组学数据对应的样本,作为训练样本,其中训练集中还包括药物分子和组学数据之间的响应参数的真实值;根据训练样本,对待训练的重定位模型进行训练;根据训练输出的响应参数的预测值和响应参数的真实值,调整重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。基于交叉采样的训练数据,结合排序损失函数和回归损失函数训练模型,学习药物分子中子结构与细胞组学数据之间的关系,学习同一药物在不同细胞系情况下的响应程度和不同药物在同一细胞系上的药物响应程度,通过训练增强模型对药物分子和组学数据之间响应参数预测的准确度,以增强重定位准确度。
[0167]
图13是根据本公开第一实施例的药物重定位装置的框图。
[0168]
如图13所示,本公开实施例的药物重定位装置1300,包括:第一获取模块1301、第二获取模块1302、第三获取模块1303和预测模块1304。
[0169]
第一获取模块1301,用于获取药物分子和细胞组学数据。
[0170]
第二获取模块1302,用于获取药物分子的第一向量表示和细胞组学数据的第二向量表示。
[0171]
第三获取模块1303,用于对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系。
[0172]
预测模块1304,用于根据预测向量矩阵和第一向量表示,对药物分子进行重定位。
[0173]
需要说明的是,上述对药物重定位方法实施例的解释说明,也适用于本公开实施例的药物重定位装置,具体过程此处不再赘述。
[0174]
综上,本公开实施例的药物重定位装置,获取药物分子和细胞组学数据;获取药物分子的第一向量表示和细胞组学数据的第二向量表示;对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组
学数据之间的相互作用关系;根据预测向量矩阵和第一向量表示,对药物分子进行重定位。基于多头注意力机制捕获药物分子中子结构与细胞组学数据之间的关系,提高了预测准确度,增强重定位准确度。
[0175]
图14是根据本公开第二实施例的药物重定位装置的框图。
[0176]
如图14所示,本公开实施例药物重定位装置1400,包括:第一获取模块1401、第二获取模块1402、第三获取模块1403和预测模块1404。
[0177]
其中,第一获取模块1401与上一实施例中的第一获取模块1301具有相同的结构和功能,第二获取模块1402与上一实施例中第二获取模块1302具有相同的结构和功能,第三获取模块1403与上一实施例中的第三获取模块1303具有相同的结构和功能,预测模块1404与上一实施例中的预测模块1304具有相同的结构和功能。
[0178]
进一步地,第二获取模块1402,包括:第一构建单元,用于根据药物分子的结构信息,生成药物分子对应的图,其中,图中的节点对应于药物分子中的原子,边对应于药物分子中的化学键;第一编码单元,用于基于图神经网络对药物分子对应的图进行编码,以获取节点的向量表示作为第一向量表示。
[0179]
进一步地,第二获取模块1402,包括:第二构建单元,用于根据细胞组学数据中基因之间的关系构建细胞组学数据对应的图,其中,图中的节点对应于基因,图中的边用于表征基因之间的关系;第二编码单元,用于基于图神经网络对细胞组学数据对应的图进行编码,以获取细胞组学数据的向量表示;第一获取单元,用于基于多层感知网络对细胞组学数据的向量表示进行多层感知处理,以获取细胞组学数据的第二向量表示。
[0180]
进一步地,第三获取模块1403,包括:第一确定单元14031,用于根据第一向量表示,确定多头注意力处理对应的查询向量矩阵;第二确定单元14032,用于根据第二向量表示,确定多头注意力处理对应的键向量矩阵和值向量矩阵;第二获取单元14033,用于根据查询向量矩阵、键向量矩阵和值向量矩阵进行多头注意力处理,以获取预测向量矩阵。
[0181]
进一步地,预测模块1404,包括:生成单元,用于对药物分子的第一向量表示进行全局池化处理,以生成药物分子的向量矩阵;第三获取单元,用于根据预测向量矩阵与药物分子对应的向量矩阵,获取药物分子与细胞组学数据之间的响应参数的预测值;重定位单元,用于根据预测值,对药物分子进行重定位。
[0182]
综上,本公开实施例的药物重定位装置,获取药物分子和细胞组学数据;获取药物分子的第一向量表示和细胞组学数据的第二向量表示;对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系;根据预测向量矩阵和第一向量表示,对药物分子进行重定位。基于多头注意力机制学习到药物分子中不同子结构的生物功能差异性,捕获药物分子中子结构与细胞组学数据之间的关系,从而更好的预测药物分子在细胞系上作用结果,提高了预测准确度,增强重定位准确度。
[0183]
图15是根据本公开第一实施例的基于重定位模型的药物重定位装置框图。
[0184]
如图15所示,本公开实施例的基于重定位模型的药物重定位装置1500,包括:第一获取模块1501、第二获取模块1502、第三获取模块1503和预测模块1504。
[0185]
第一获取模块1501,获取药物分子和细胞组学数据,并将药物分子和细胞组学数据输入训练后的目标重定位模型。
[0186]
第二获取模块1502,用于由目标重定位模型中的编码网络,获取药物分子的第一向量表示和细胞组学数据的第二向量表示。
[0187]
第三获取模块1503,用于由目标重定位模型中的多头注意力网络,对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系。
[0188]
预测模块1504,用于由目标重定位模型中的预测网络,根据预测向量矩阵和第一向量表示,对药物分子进行重定位。
[0189]
需要说明的是,上述对基于重定位模型的药物重定位方法实施例的解释说明,也适用于本公开实施例的基于重定位模型的药物重定位装置,具体过程此处不再赘述。
[0190]
综上,本公开实施例的基于重定位模型的药物重定位装置,获取药物分子和细胞组学数据,并将药物分子和细胞组学数据输入训练后的目标重定位模型;由目标重定位模型中的编码网络,获取药物分子的第一向量表示和细胞组学数据的第二向量表示;由目标重定位模型中的多头注意力网络,对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系;由目标重定位模型中的预测网络,根据预测向量矩阵和第一向量表示,对药物分子进行重定位。使用多头注意力机制对药物分子与细胞组学数据进行建模,同时通过图神经网络提取药物分子特征,结合图神经网络和多层感知提取组学数据的特征,可适用于多种类型的药物分子,增强模型的通用性,通过多头注意力机制学习药物分子中子结构与细胞组学数据之间的关系,基于训练好的目标重定位模型进行药物分子重定位,提高了预测准确度,增强重定位准确度。
[0191]
图16是根据本公开第二实施例的基于重定位模型的药物重定位装置的框图。
[0192]
如图16所示,本公开实施例基于重定位模型的药物重定位装置1600,包括:第一获取模块1601、第二获取模块1602、第三获取模块1603和预测模块1604。
[0193]
其中,第一获取模块1601与上一实施例中的第一获取模块1501具有相同的结构和功能,第二获取模块1602与上一实施例中第二获取模块1502具有相同的结构和功能,第三获取模块1603与上一实施例中的第三获取模块1503具有相同的结构和功能,预测模块1604与上一实施例中的预测模块1504具有相同的结构和功能。
[0194]
进一步地,装置1600还包括:第一构建模块,用于根据药物分子的结构信息,生成药物分子对应的图,其中,图中的节点对应于药物分子中的原子,边对应于药物分子中的化学键。
[0195]
进一步地,编码网络包括图神经网络,第二获取模块1602,包括:第一编码单元,用于基于图神经网络对药物分子对应的图进行编码,以获取节点的向量表示作为第一向量表示。
[0196]
进一步地,装置1600还包括:第二构建模块,用于根据细胞组学数据中基因之间的关系构建细胞组学数据对应的图,其中,图中的节点对应于基因,图中的边用于表征基因之间的关系。
[0197]
进一步地,编码网络包括图神经网络和多层感知网络,第二获取模块1602,包括:第二编码单元,用于基于图神经网络对细胞组学数据对应的图进行编码,以获取细胞组学数据的向量表示;第一获取单元,用于基于多层感知网络对细胞组学数据的向量表示进行
多层感知处理,以获取细胞组学数据的第二向量表示。
[0198]
进一步地,多头注意力网络包括多个线性层和多个注意力层,第三获取模块1603,包括:确定单元16031,用于分别由多个线性层根据第一向量表示,确定多头注意力处理对应的查询向量矩阵,以及根据第二向量表示,确定多头注意力处理对应的键向量矩阵和值向量矩阵;第二获取单元16032,用于由多个注意力层根据查询向量矩阵、键向量矩阵和值向量矩阵进行多头注意力处理,以获取预测向量矩阵。
[0199]
进一步地,预测网络包括池化层、拼接层和多层感知层,预测模块1604,包括:第一生成单元,用于由池化层对药物分子的第一向量表示进行全局池化处理,以生成药物分子的向量矩阵;第二生成单元,用于由拼接层对预测向量矩阵和药物分子的向量矩阵进行堆叠处理,以生成待处理矩阵;第三获取单元,用于由多层感知层,根据待处理矩阵,获取药物分子与细胞组学数据之间的响应参数的预测值,并根据预测值,对药物分子进行重定位。
[0200]
本公开实施例的基于重定位模型的药物重定位装置,获取药物分子和细胞组学数据,并将药物分子和细胞组学数据输入训练后的目标重定位模型;由目标重定位模型中的编码网络,获取药物分子的第一向量表示和细胞组学数据的第二向量表示;由目标重定位模型中的多头注意力网络,对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系;由目标重定位模型中的预测网络,根据预测向量矩阵和第一向量表示,对药物分子进行重定位。使用多头注意力机制对药物分子与细胞组学数据进行建模,同时通过图神经网络提取药物分子特征,结合图神经网络和多层感知提取组学数据的特征,可适用于多种类型的药物分子,增强模型的通用性,通过多头注意力机制学习药物分子中不同子结构的生物功能差异性及药物分子中子结构与细胞组学数据之间的关系,从而更好的预测药物分子在细胞系上作用结果,基于训练好的目标重定位模型进行药物分子重定位提高了预测准确度,增强重定位准确度。
[0201]
图17是根据本公开第一实施例的重定位模型的训练装置的框图。
[0202]
如图17所示,本公开实施例的重定位模型的训练装置1700,包括:获取模块1701、训练模块1702和更新模块1703。
[0203]
获取模块1701,用于从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分子和同一细胞系的组学数据对应的样本,作为训练样本,其中训练集中还包括药物分子和组学数据之间的响应参数的真实值。
[0204]
训练模块1702,用于根据训练样本,对待训练的重定位模型进行训练。
[0205]
更新模块1703,用于根据响应参数的真实值和训练过程中输出的响应参数的预测值,调整重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。
[0206]
需要说明的是,上述对重定位模型的训练方法实施例的解释说明,也适用于本公开实施例的重定位模型的训练装置,具体过程此处不再赘述。
[0207]
综上,本公开实施例的重定位模型的训练装置,从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分子和同一细胞系的组学数据对应的样本,作为训练样本,其中训练集中还包括药物分子和组学数据之间的响应参数的真实值;根据训练样本,对待训练的重定位模型进行训练;根据响应参数的真实值和训练过程中输出
的响应参数的预测值,调整重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。基于交叉采样获取训练样本,训练模型收敛,以使模型在训练中学习药物分子中子结构与细胞组学数据之间的关系,学习同一药物在不同细胞系情况下的响应程度和不同药物在同一细胞系上的药物响应程度,通过训练增强模型对药物分子和组学数据之间响应参数预测的准确度,以增强重定位准确度。
[0208]
图18是根据本公开第二实施例的重定位模型的训练装置的框图。
[0209]
如图18所示,本公开实施例重定位模型的训练装置1800,包括:获取模块1801、训练模块1802和更新模块1803。
[0210]
其中,获取模块1801与上一实施例中的获取模块1701具有相同的结构和功能,训练模块1802与上一实施例中训练模块1702具有相同的结构和功能,更新模块1803与上一实施例中的更新模块1703具有相同的结构和功能。
[0211]
进一步地,更新模块1803,包括:第一确定单元18031,用于根据响应参数的真实值和训练过程中输出的响应参数的预测值,确定排序损失函数值和回归损失函数值;第二确定单元18032,用于根据排序损失函数值和回归损失函数值,确定模型训练的损失函数值;调整单元18033,用于根据损失函数调整重定位模型的模型参数。
[0212]
进一步地,第二确定单元,包括:确定子单元,用于基于预设权重,对排序损失函数和回归损失函数求和,得到模型训练的损失函数。
[0213]
综上,本公开实施例的重定位模型的训练装置,从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分子和同一细胞系的组学数据对应的样本,作为训练样本,其中训练集中还包括药物分子和组学数据之间的响应参数的真实值;根据训练样本,对待训练的重定位模型进行训练;根据响应参数的真实值和训练过程中输出的响应参数的预测值,调整重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。基于交叉采样的训练数据,结合排序损失函数和回归损失函数训练模型,学习药物分子中子结构与细胞组学数据之间的关系,学习同一药物在不同细胞系情况下的响应程度和不同药物在同一细胞系上的药物响应程度,通过训练增强模型对药物分子和组学数据之间响应参数预测的准确度,以增强重定位准确度。
[0214]
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0215]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0216]
图19示出了可以用来实施本公开的实施例的示例电子设备1900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0217]
如图19所示,电子设备1900包括计算单元1901,其可以根据存储在只读存储器(rom)1902中的计算机程序或者从存储单元1908加载到随机访问存储器(ram)1903中的计
算机程序,来执行各种适当的动作和处理。在ram 1903中,还可存储电子设备1900操作所需的各种程序和数据。计算单元1901、rom1902以及ram1903通过总线1904彼此相连。输入/输出(i/o)接口1905也连接至总线1904。
[0218]
电子设备1900中的多个部件连接至i/o接口1905,包括:输入单元1906,例如键盘、鼠标等;输出单元1907,例如各种类型的显示器、扬声器等;存储单元1908,例如磁盘、光盘等;以及通信单元1909,例如网卡、调制解调器、无线通信收发机等。通信单元1909允许电子设备1900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0219]
计算单元1901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1901的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元1901执行上文所描述的各个方法和处理,例如图1至图5所示的药物重定位方法,或者图6-图8所示的基于重定位模型的药物重定位方法,或者图9-图12所示的重定位模型的训练方法。例如,在一些实施例中,上述方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1908。在一些实施例中,计算机程序的部分或者全部可以经由rom 1902和/或通信单元1909而被载入和/或安装到电子设备1900上。当计算机程序加载到ram1903并由计算单元1901执行时,可以执行上文描述的语义解析方法的一个或多个步骤。备选地,在其他实施例中,计算单元1901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行语音处理方法。
[0220]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0221]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0222]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0223]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0224]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、互联网以及区块链网络。
[0225]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务("virtual private server",或简称"vps")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0226]
根据本公开的实施例,本公开还提供了一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时实现根据本公开上述实施例所示的语音处理方法的步骤。
[0227]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0228]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献