一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于量子门控循环神经网络的分子生成方法及装置与流程

2022-05-08 04:39:58 来源:中国专利 TAG:


1.本发明涉及量子计算领域,具体涉及一种基于量子门控循环神经网络的分子生成方法及装置。


背景技术:

2.小型有机分子的化学空间包含的化学结构众多,并且药物设计主要目标之一是找到能够以所需方式调节给定靶标(通常是蛋白质),使得化学家们在分子的de novo设计这一问题上需要解决一个复杂的多元优化任务。之前传统的方法大部分都需要先验知识,例如需要知道结构-活性关系,化学转化规则等。现有技术中已存在利用可以生成图像或者生成文本的深度生成模型来生成分子。
3.虽然分子生成的问题基于门控循环神经网络模型取得了较好的的性能,但是门控循环神经网络算法需满足建立序列长期短期依赖关系的需求,并消耗大量计算资源,同时存在梯度消失的缺陷。


技术实现要素:

4.本发明是为了解决上述问题而进行的,目的在于提供一种基于量子门控循环神经网络的分子生成方法及装置。
5.本发明提供了一种基于量子门控循环神经网络的分子生成方法,具有这样的特征,包括:将包含分子表达信息的分子序列进行预处理得到分子序列对应的输入向量;将输入向量输入到量子门控循环单元中进行计算,依次遍历构成分子序列的所有化学元素,得到先前已处理的所有化学元素对应的的隐藏状态;对先前已处理的所有化学元素对应的的隐藏状态进行线性变换,输出生成的分子。
6.本发明提供的方法中,还具有这样的特征:其中,量子门控循环单元包括第一量子线路、第二量子线路以及第三量子线路,第一量子线路用于筛选先前隐藏状态下需要保留的化学元素;第二量子线路用于确定先前隐藏状态下需要保留的化学元素与当前需要保留的化学元素;第三量子线路用于确定先前隐藏状态下需要保留的化学元素。
7.本发明提供的方法中,还具有这样的特征:其中,第一量子线路包括第一变分量子线路、第二变分量子线路,第一量子线路的表达式如下:
8.r
t
=softmax(vqc1(x
t
) vqc2(h
t-1
))
9.softmax为激活函数,vqc1为第一变分量子线路,x
t
为t时刻的化学元素,h
t-1
为t-1时刻的化学元素生成的隐藏状态,vqc2为第二变分量子线路。
10.本发明提供的方法中,还具有这样的特征:其中,第二量子线路包括第三变分量子线路、第四变分量子线路,
11.第二量子线路的表达式如下:
12.n
t
=tanh(vqc3(x
t
) r
t
*vqc4(h
t-1
))
13.tanh为激活函数,vqc3为第三变分量子线路,r
t
为第一量子线路,vqc4为第四变分
量子线路。
14.本发明提供的方法中,还具有这样的特征:其中,第三量子线路的表达式如下:
15.z
t
=softmax(vqc5(x
t
) vqc6(h
t-1
))
16.vqc5为第五变分量子线路,vqc6为第六变分量子线路。
17.本发明提供的方法中,还具有这样的特征:其中,先前已处理的所有化学元素对应的的隐藏状态的表达式如下:
18.h
t
=(1-z
t
)*n
t
z
t
*h
t-1
19.z
t
为第三量子线路,n
t
为第二量子线路。
20.本发明提供的方法中,还具有这样的特征:其中,任一变分量子线路均包括预定数目的参数化旋转模块与纠缠模块,参数化旋转模块用于提供变分量子线路可学习的参数;纠缠模块用于提供纠缠的多比特量子态。
21.本发明提供的方法中,还具有这样的特征:其中,任一变分量子线路用于提取、压缩构成分子序列的化学元素及其生成的隐藏状态,从而输出化学元素及隐藏状态各自对应的变分矢量,具体过程如下:将任意输入向量作为任一变分量子线路的相等叠加初始状态,并对其进行编码后输出对应的量子叠加态;将量子叠加态输入至参数化旋转模块与纠缠模块中进行幺正变换,输出变分矢量,经测量后输入至全连接神经网络,并通过softmax激活函数输出生成的分子。
22.本发明提供的方法中,还具有这样的特征:其中,利用交叉熵损失函数对生成的分子进行优化。
23.本发明提供了一种基于量子门控循环神经网络的预测装置,具有这样的特征,包括:输入向量获取模块,用于将包含分子表达信息的分子序列进行预处理得到分子序列对应的输入向量;先前已处理的所有化学元素对应的隐藏状态获取模块,用于将输入向量输入到量子门控循环单元中进行计算,依次遍历构成分子序列的所有化学元素,得到先前已处理的所有化学元素对应的的隐藏状态;分子生成模块,用于对先前已处理的所有化学元素对应的隐藏状态进行线性变换,输出生成的分子。
24.发明的作用与效果
25.根据本发明所涉及的基于量子门控循环神经网络的分子生成方法,因为该方法使用量子门控循环单元对包含分子表达信息的分子序列中的化学元素及其对应的隐藏状态进行重置和更新,生成新的隐藏状态,从而得到生成的分子,所以,该方法满足了门控循环神经网络算法建立序列长期短期依赖关系的需求,并且计算资源消耗少,因此在量子芯片和电子芯片的协同工作及生物医药领域中具有广泛的应用前景。
26.根据本发明所涉及的基于量子门控循环神经网络的分子生成装置,因为该装置包括先前已处理的所有化学元素对应的隐藏状态获取模块,该模块中的量子门控循环单元通过对包含分子表达信息的分子序列中的化学元素及其对应的隐藏状态进行重置和更新,生成新的隐藏状态,从而得到生成的分子,所以,该装置满足了门控循环神经网络算法建立序列长期短期依赖关系的需求,并且计算资源消耗少,因此在量子芯片和电子芯片的协同工作及生物医药领域中具有广泛的应用前景。
附图说明
27.图1是本发明的实施例中基于量子门控循环神经网络的分子生成方法的流程图;
28.图2是本发明的实施例中基于量子门控循环神经网络的分子生成装置的结构示意图;
29.图3是本发明的实施例中第一量子线路的结构示意图;
30.图4是本发明的实施例中基于量子循环神经网络的分子生成装置的另一结构示意图。
具体实施方式
31.为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下结合实施例及附图对本发明作具体阐述。
32.《实施例》
33.图1是本发明的实施例中基于量子门控循环神经网络的分子生成方法的流程图。
34.如图1所示,本实施例提供的基于量子门控循环神经网络的分子生成方法包括如下步骤:
35.步骤s1,将包含分子表达信息的分子序列进行预处理得到分子序列对应的输入向量。
36.本实施例中,对分子序列进行预处理包括:
37.步骤s1-1,从chembl22的数据库中获取有生物活性的化合物集合;
38.步骤s1-2,去除该化合物集合中含盐、立体化学信息、核酸和多肽和标识k
d/i
,/ic
50
,ec
50
》1μm的化合物,得到待分析化合物的分子表达信息的分子序列。
39.在本实施例中,分子表达信息的分子序列为分子的简化分子线性输入规范(smiles)字符串,即用字符串来表示分子的化学结构,每一个字符代表化学元素或者结构的信息。
40.在本实施例中,通过embedding(嵌入层)将分子对应的整数序列的每一个整数转换成向量,变成向量序列,即分子序列对应的输入向量。
41.步骤s2,将输入向量输入到量子门控循环单元中进行计算,依次遍历构成分子序列的所有化学元素,得到先前已处理的所有化学元素对应的隐藏状态。
42.图2是本发明的实施例中基于量子门控循环神经网络的分子生成装置的结构示意图。
43.如图2所示,本实施例提供的基于量子门控循环神经网络的分子生成装置51包括第一量子线路52、第二量子线路53、第三量子线路54。
44.第一量子线路52用于筛选先前隐藏状态下需要保留的化学元素,第一量子线路52包括第一变分量子线路521、第二变分量子线路522。
45.其中,第一量子线路52的表达式如下:
46.r
t
=softmax(vqc1(x
t
) vqc2(h
t-1
))
47.softmax为激活函数,vqc1为第一变分量子线路521,x
t
为t时刻要处理的化学元素,h
t-1
为t-1时刻的化学元素生成的隐藏状态,vqc2为第二变分量子线路522。
48.图3是本发明的实施例中第一量子线路的结构示意图。
49.如图3所示,本实施例提供的第一量子线路52包括第一变分量子线路521与第二变分量子线路522。
50.图3a为第一变分量子线路的结构示意图。
51.如图3a所示,第一变分量子线路521用于提取构成分子序列的化学元素x
t
并对其进行压缩,从而输出化学元素对应的变分矢量,第一变分量子线路521包括参数化旋转模块5211、纠缠模块5212。
52.参数化旋转模块5211用于提供第一变分量子线路521可学习的参数,并将输入向量中的每个元素编码为量子叠加态。
53.在本实施利中,通过如下公式将输入向量编码为叠加量子态,具体公式如下:
[0054][0055]
其中,求和指标i是十进制的数,代表相应的基态的位串。n维的输入向量x=(x1,...,xn)对应分子序列中的每一个化学元素,并且n维输入向量x中的每一个元素将被用来生成两个旋转角度,比如,arctan(x1),第一个旋转角的生成通过旋转y轴(参数化泡利旋转门ry)得到,第二个旋转角的生成是通过旋转z轴(参数化泡利旋转门rz)得到。通过给每一个量子比特施加两个旋转操作,使得作为相等叠加初始状态的输入向量x转变成对应的量子叠加态。在其他实施例中,也可使用其他编码方式。
[0056]
纠缠模块5212包括预定数目的控制非门5213和单比特旋转门(u)5214。
[0057]
控制非门5213作用在量子叠加态中每一对相邻的量子比特上,或者间隔为一的量子比特上,从而创造出纠缠的多比特量子态。
[0058]
单比特旋转门5214具有多个旋转角度,如θ[0]、θ[1]
……
θ[11],利用现有的优化方式对单比特旋转门5214中的旋转角度进行计算,并对前n个量子比特进行测量,输出的量子态为2n维矢量。重复对分子序列中的每一个化学元素使用第一变分量子线路521,输出所有化学元素对应的变分矢量。
[0059]
图3b为第二变分量子线路的结构示意图。
[0060]
如图3b所示,第二变分量子线路522的结构与第一变分量子线路521的结构相同,区别仅在于第二变分量子线路522用于提取第一变分量子线路521输入的化学元素x
t
生成的隐藏状态h
t-1
并对该隐藏状态进行压缩,从而输出隐藏状态对应的变分矢量,在此不再赘述。
[0061]
如图2所示,第二量子线路53包括第三变分量子线路531与第四变分量子线路532。
[0062]
第二量子线路53用于确定先前隐藏状态下需要保留的化学元素与当前需要保留的化学元素。
[0063]
在本实施例中,第二量子线路53的表达式如下:
[0064]nt
=tanh(vqc3(x
t
) r
t
*vqc4(h
t-1
))
[0065]
tanh为激活函数,vqc3为第三变分量子线路531,r
t
为第一量子线路52,vqc4为第四变分量子线路532。
[0066]
在本实施例中,第三变分量子线路531与第一变分量子线路521的结构相同,第四
变分量子线路532与第二变分量子线路522的结构相同,在此不再赘述。
[0067]
第三量子线路54用于确定先前隐藏状态下需要保留的化学元素,第三量子线路54的表达式如下:
[0068]zt
=softmax(vqc5(x
t
) vqc6(h
t-1
))
[0069]
vqc5为第五变分量子线路541,vqc6为第六变分量子线路542,第五变分量子线路541与第一变分量子线路521的结构相同,第六变分量子线路542与第二变分量子线路522的结构相同,在此不再赘述。
[0070]
在本实施例中,先前已处理的所有化学元素对应的隐藏状态的表达式如下:
[0071]ht
=(1-z
t
)*n
t
z
t
*h
t-1
[0072]zt
为第三量子线路54,n
t
为第二量子线路53。
[0073]
步骤s3,对先前已处理的所有化学元素对应的隐藏状态进行线性变换,输出生成的分子。
[0074]
在本实施例中,利用交叉熵损失函数对生成的分子进行优化。
[0075]
图4是本发明的实施例中基于量子门控循环神经网络的分子生成装置的另一结构示意图。
[0076]
如图4所示,本发明的实施例提供的基于量子门控循环神经网络的分子生成装置100包括输入向量获取模块10、先前已处理的所有化学元素对应的隐藏状态获取模块20、分子生成模块30。
[0077]
输入向量获取模块10采用步骤s1的方法,将包含分子表达信息的分子序列进行预处理得到分子序列对应的输入向量。
[0078]
先前已处理的所有化学元素对应的隐藏状态获取模块20采用步骤s2的方法,将输入向量输入到量子门控循环单元中进行计算,依次遍历构成分子序列的所有化学元素,得到先前已处理的所有化学元素对应的的隐藏状态。
[0079]
分子生成模块30采用步骤s3的方法,对先前已处理的所有化学元素对应的隐藏状态进行线性变换,输出生成的分子。
[0080]
实施例的作用与效果
[0081]
根据本实施例所涉及的基于量子门控循环神经网络的分子生成方法,因为该方法使用量子门控循环单元对包含分子表达信息的分子序列中的化学元素及其对应的隐藏状态进行重置和更新,生成新的隐藏状态,从而得到生成的分子,所以,该方法满足了门控循环神经网络算法建立序列长期短期依赖关系的需求,并且计算资源消耗少,因此在量子芯片和电子芯片的协同工作及生物医药领域中具有广泛的应用前景。
[0082]
进一步地,因为本实施例将gru和量子变分门进行结合,从而提出量子门控循环神经网络模型来生成分子,并使得生成的分子具备类似的活性、类药性、可合成性,同时这些生成的分子具有大量新的分子和新的骨架,可以作为未来分子从头设计的候选方法,并且在未来的nisq(近期量子计算机)上,能够大大提高学习速度,有效避免梯度消失问题,在生物医药领域具有更广泛的应用前景。
[0083]
进一步地,因为本实施例将分子序列用简化分子线性输入规范(smiles)进行表示,即用字符串来表示分子的化学结构,所以在匹配结构和生物特征训练数据分布任务上具有最佳性能,并且gru通常以前向方式(从左到右)训练读取和产生smiles,然而smiles能
够从非氢原子开始并沿任何方向进行生成,所以,用smiles字符串来表示分子序列的化学结构可以提供大量新的分子和新的骨架。
[0084]
进一步地,对于存储有计算机程序的存储介质,该计算机程序可以被设置为运行时执行本实施例提供的基于量子门控循环神经网络的分子生成方法。
[0085]
进一步地,对于包含存储器和处理器的电子产品,该存储器中存储有计算机程序,并且该处理器被设置为运行其存储的计算机程序以执行本实施例提供的基于量子门控循环神经网络的分子生成方法。
[0086]
上述实施方式为本发明的优选案例,并不用来限制本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献