基于深度学习的化学反应转化率预测方法、系统及介质与流程

2022-03-19 20:29:51 来源：中国专利 TAG：

1.本发明涉及化学反应的技术领域，尤其涉及到基于深度学习的化学反应转化率预测方法、系统及介质。

背景技术：

2.反应转化率是化学反应的实际反应产物与理论反应产物的比值，理想条件下，一个化学反应的转化率应为100％，但是在现实条件下，受到温度、浓度等条件的影响，大部分反应的转化率都达不到100％。
3.在化学反应流程设计中，通过几步甚至几十步反应生成所需产物的情况较为常见。反应流程中不论哪一步转化率过低，都会因为累加效应对整个反应流程造成致命影响。因此，设计转化率高的化学反应显得尤为重要。
4.近些年来，深度学习在各个领域都取得了不错的成效，许多人开始尝试使用深度学习的方法预测反应转化率，以此帮助整个化学反应流程的设计，但现有的化学反应转化率预测模型大多面向某种特定的反应类型，如[1]ahneman d t,estrada j g,lin s,dreher s d and doyle a g 2018 predicting reaction performance in c
–
ncross-coupling using machine learning science 360 186
–
90.和[2]chuang k vand keiser m j 2018 comment on“predicting reaction performance in c
–
n cross-coupling using machine learning”science 362 6416.，这类模型通用性不强。最近，虽然基于自然语言处理技术的通用型转化率预测模型[3]schwaller p,vaucher a c,laino t,et al.prediction of chemical reaction yields using deep learning[j].machine learning:science and technology,2021,2(1):015016也被提出，但该方法直接将整个反应式作为模型的输入，并未充分考虑不同的反应物对反应式及转化率的影响，没有充分利用反应物信息。

技术实现要素：

[0005]
本发明的目的在于克服现有技术的不足，提供一种预测精度高的化学反应转化率预测方法。
[0006]
为实现上述目的，本发明所提供的技术方案为：
[0007]
化学反应转化率预测方法，包括以下步骤：
[0008]
s1、从参加化学反应的反应物的所属类型中选出对化学反应转化率影响最大的反应物类型a；
[0009]
s2、进行反应物类型a的反应物和化学反应对应的化学反应式r的分词及特征提取，得到对应的特征xr和xa；
[0010]
s3、结合特征xr和xa，通过注意力机制求取反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm；
[0011]
s4、利用宽度学习系统对反应物类型a的反应物的深层表征信息ta、化学反应对应
的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm进行融合，并预测化学反应转化率。
[0012]
进一步地，所述步骤s1根据每种反应物类型下的不同分子数目，将不同分子数目最多的反应物类型作为对化学反应转化率影响最大的反应物类型。
[0013]
如，若某一类化学反应式r定义为a b-》c，其中a＝{a1,a2,
…
,an}，b＝{b1,b2,
…
,bm}，a类型的反应物中有n种不同的分子，b类型的反应物中有m中不同的分子。若n》m，则将a类型作为对化学反应转化率影响最大的反应物类型。
[0014]
进一步地，所述步骤s2包括：
[0015]
s2-1、将反应物类型a的反应物和化学反应对应的化学反应式r均转化为smiles序列，得到sr和sa；
[0016]
s2-2、利用rxnfp模型对反应物类型a的反应物和化学反应对应的化学反应式r的smiles序列sr和sa进行分词及特征提取，得到进行分词及特征提取，得到其中nr为化学反应式r中分词节点的个数，na为反应物类型a的反应物中分词节点的个数，db表示输出的特征维度，cls分词不表示任何语义，在于获取反应式或分子的整体特征。
[0017]
进一步地，所述步骤s3使用多头点积缩放注意力机制求取反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm，过程包括：
[0018]
注意力函数为:
[0019][0020]
其中，查询集q＝{q1,q2,
…
,qn}，键集合k＝{k1,k2,
…
,km}，dk为ki的维度，i∈[1,m]；
[0021]
在平行子空间中分别学习h个不同的注意力分数，并将该h个不同的注意力分数拼接起来：
[0022]
multihead(k,q,v)＝concat(heak1,head2,
…
,headh)wo[0023]
headi＝attention(k,q,v)
[0024]
其中wo为需要学习的参数，
[0025]
为了更深入挖掘反应式信息和反应物信息，使用多头注意力机制和残差模块对反应物类型a的反应物、化学反应对应的化学反应式r以及该两者的关系进行自注意力计算：
[0026][0027][0028][0029]
其中norm为标准化层，为
可学习的注意力参数，维度均为该层输出tr为化学反应对应的化学反应式r的深层表征信息，ta为反应物类型a的反应物的深层表征信息，tm为两者的关系信息。
[0030]
进一步地，所述步骤s4包括：
[0031]
s4-1、将反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm融合得到t：
[0032]
t＝[tr；ta；tm]
[0033]
s4-2、将t通过特征层映射得到zi：
[0034][0035]
其中和为随机参数，φ为激活函数，n为特征层的节点窗口数，每个窗口有k个节点；
[0036]
s4-3、将得到的所有特征记为zn＝[z1,z2,
…
,zn]，且该些特征经过增强层得到增强特征hm，其中第i个增强特征的计算方式为：
[0037][0038]
其中和是随机参数，ξ为激活函数；
[0039]
s4-4、预测的转化率y：
[0040]
y＝[z1,z2,
…
,zn|h1,h2,
…
,hm]wm＝[zn|hm]wm[0041]
其中wm通过伪逆运算计算所得。
[0042]
为实现上述目的，本发明另外提供一种化学反应转化率预测系统，该化学反应转化率预测系统用于实现上述化学反应转化率预测方法，其包括辅助反应物选择模块、特征提取模块、注意力模块、宽度学习模块；
[0043]
其中，
[0044]
所述辅助反应物选择模块，用于从参加化学反应的反应物的所属类型中选出对化学反应转化率影响最大的反应物类型a；
[0045]
所述特征提取模块，用于反应物类型a的反应物和化学反应对应的化学反应式r的分词及特征提取，得到对应的特征xr和xa；
[0046]
所述注意力模块，用于通过注意力机制求取反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm；
[0047]
所述宽度学习模块，用于融合反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm，并预测化学反应转化率。
[0048]
为实现上述目的，本发明另外提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序配置为由处理器调用时实现上述化学反应转化率预测方法的步骤。
[0049]
与现有技术相比，本技术方案的原理及优点如下：
[0050]
本技术方案从参加化学反应的反应物的所属类型中选出对化学反应转化率影响最大的反应物类型a，并进行反应物类型a的反应物和化学反应对应的化学反应式r的分词
及特征提取，得到对应的特征xr和xa，接着结合特征xr和xa，通过注意力机制求取反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm，最后利用宽度学习系统对反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm进行融合，并预测化学反应转化率，这不仅考虑了反应式信息，更考虑了对化学反应转化率影响最大的反应物类型a的信息，以及他们之间的关系信息，使得对化学反应转化率有影响的信息均得到充分的考虑和利用，从而大大提高了化学反应转化率的预测精度。
附图说明
[0051]
为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的服务作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0052]
图1为本发明实施例化学反应转化率预测方法的原理流程图；
[0053]
图2为本发明实施例化学反应转化率预测系统的结构示意图。
具体实施方式
[0054]
下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。
[0055]
实施例1：
[0056]
如图1所示，本实施例所述的化学反应转化率预测方法，包括以下步骤：
[0057]
s1、从参加化学反应的反应物的所属类型中选出对化学反应转化率影响最大的反应物类型a；
[0058]
具体为，根据每种反应物类型下的不同分子数目，将不同分子数目最多的反应物类型作为对化学反应转化率影响最大的反应物类型。
[0059]
s2、进行反应物类型a的反应物和化学反应对应的化学反应式r的分词及特征提取，得到对应的特征xr和xa；
[0060]
具体地，本步骤具体包括：
[0061]
s2-1、将反应物类型a的反应物和化学反应对应的化学反应式r均转化为smiles序列，得到sr和sa；
[0062]
s2-2、利用rxnfp模型对反应物类型a的反应物和化学反应对应的化学反应式r的smiles序列sr和sa进行分词及特征提取，得到进行分词及特征提取，得到其中nr为化学反应式r中分词节点的个数，na为反应物类型a的反应物中分词节点的个数，db表示输出的特征维度，cls分词不表示任何语义，在于获取反应式或分子的整体特征。
[0063]
本实施例中，db＝256，nr的最大值为300，na的最大值为100。
[0064]
s3、为了挖掘反应物与反应式之间的关系，得到相互关系的辅助信息，本步骤结合
特征xr和xa，通过注意力机制求取反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm；
[0065]
具体地，本步骤的过程如下：
[0066]
注意力函数为:
[0067][0068]
其中，查询集q＝{q1,q2,
…
,qn}，键集合k＝{k1,k2,
…
,km}，dk为ki的维度，i∈[1,m]；
[0069]
在平行子空间中分别学习h个不同的注意力分数，并将该h个不同的注意力分数拼接起来：
[0070]
multihead(k,q,v)＝concat(head1,head2,
…
,headh)wo[0071]
headi＝attention(k,q,v)
[0072]
其中wo为需要学习的参数，
[0073]
为了更深入挖掘反应式信息和反应物信息，使用多头注意力机制和残差模块对反应物类型a的反应物、化学反应对应的化学反应式r以及该两者的关系进行自注意力计算：
[0074][0075][0076][0077]
其中norm为标准化层，为可学习的注意力参数，维度均为该层输出tr为化学反应对应的化学反应式r的深层表征信息，ta为反应物类型a的反应物的深层表征信息，tm为两者的关系信息。
[0078]
上述中，步骤s2和步骤s3需要通过反向传播机制学习，训练中使用mse(mean squared error)作为损失函数。其中步骤s3的注意力头数h＝8.
[0079]
s4、利用宽度学习系统对反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm进行融合，并预测化学反应转化率。
[0080]
具体地，本步骤的过程如下：
[0081]
s4-1、将反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm融合得到t：
[0082]
t＝[tr；ta；tm]
[0083]
s4-2、将t通过特征层映射得到zi：
[0084][0085]
其中和为随机参数，φ为激活函数，n为特征层的节点窗口数，每个窗口有k个节点；
[0086]
s4-3、将得到的所有特征记为zn＝[z1,z2,
…
,zn]，且该些特征经过增强层得到增强特征hm，其中第i个增强特征的计算方式为：
[0087][0088]
其中和是随机参数，ξ为激活函数；
[0089]
s4-4、预测的转化率y：
[0090]
y＝[z1,z2,
…
,zn|h1,h2,
…
,hm]wm＝[zn|hm]wm[0091]
其中wm通过伪逆运算计算所得。
[0092]
本实施例从参加化学反应的反应物的所属类型中选出对化学反应转化率影响最大的反应物类型a，并进行反应物类型a的反应物和化学反应对应的化学反应式r的分词及特征提取，得到对应的特征xr和xa，接着结合特征xr和xa，通过注意力机制求取反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm，最后利用宽度学习系统对反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm进行融合，并预测化学反应转化率，这不仅考虑了反应式信息，更考虑了对化学反应转化率影响最大的反应物类型a的信息，以及他们之间的关系信息，使得对化学反应转化率有影响的信息均得到充分的考虑和利用，从而大大提高了化学反应转化率的预测精度。
[0093]
实施例2：
[0094]
如图2所示，本实施例所述的化学反应转化率预测系统用于实现上述化学反应转化率预测方法，其包括辅助反应物选择模块1、特征提取模块2、注意力模块3、宽度学习模块4；
[0095]
其中，
[0096]
所述辅助反应物选择模块1，用于从参加化学反应的反应物的所属类型中选出对化学反应转化率影响最大的反应物类型a；
[0097]
所述特征提取模块2，用于反应物类型a的反应物和化学反应对应的化学反应式r的分词及特征提取，得到对应的特征xr和xa；
[0098]
所述注意力模块3，用于通过注意力机制求取反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm；
[0099]
所述宽度学习模块4，用于融合反应物类型a的反应物的深层表征信息ta、化学反应对应的化学反应式r的深层表征信息tr、反应物和反应式的关系信息tm，并预测化学反应转化率。
[0100]
实施例3：
[0101]
本实施例为一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序配置为由处理器调用时实现上述化学反应转化率预测方法的步骤。
[0102]
以上所述之实施例子只为本发明之较佳实施例，并非以此限制本发明的实施范围，故凡依本发明之形状、原理所作的变化，均应涵盖在本发明的保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

基于深度学习的化学反应转化率预测方法、系统及介质与流程

相关文献

最热文献