一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

逆合成/化学反应可行性预测方法、系统、介质及设备与流程

2022-06-12 02:00:02 来源:中国专利 TAG:


1.本发明属于计算机化学技术领域,涉及一种化学反应可行性预测方法,特别是涉及一种逆合成/化学反应可行性预测方法、系统、介质及设备。


背景技术:

2.逆合成分析法(retrosynthetic analysis)又称切断法(the disconnection approach),是有机合成路线设计的最基本、最常用的方法。逆合成分析法是一种可逆向的逻辑思维方法,从剖析目标分子的化学结构入手,根据分子中各原子间连接方式(化学键)的特征,综合运用有机化学反应方法和反应机制的知识,选择合适的化学键进行切断,将目标分子转化成一些稍小的中间体;再以这些中间体作为新的目标分子,将其切断成更小的中间体;依次类推,直到找到可以方便购得的起始材料为止。是从合成产物的分子结构入手,采用“切断一种化学键”分析法,来得到所需合成原料(合成子)的方法。
3.在化学家进行逆合成分析的过程中,需要花费大量的时间去验证逆合成路径的每一步是否可行,是否会出现异常。即使获得了可行的逆合成路径,也无法确定该路径是否是各种可行的逆合成路径中较优的路径。


技术实现要素:

4.鉴于以上所述现有技术的缺点,本发明的目的在于提供一种逆合成/化学反应可行性预测方法、系统、介质及设备,用于对逆合成路径设计步骤中的化学反的可行性进行有效预测。
5.为实现上述目的及其他相关目的,本发明提供一种化学反应可行性预测方法,所述化学反应可行性预测方法包括:获取设计化学反应的反应物与生成物;提取所述反应物的官能团和所述设计化学反应的反应模板;根据所述反应物的各官能团计算所述设计化学反应的兼容性和反应性;根据所述反应模板计算所述设计化学反应的选择性;根据所述兼容性、反应性和选择性评估获得所述设计化学反应可行性的预测结果。
6.于本发明的一实施例中,所述提取所述反应物的官能团的一种实现过程包括:抽取与反应物的每个中心原子直接连键的第一相邻原子,获得所述反应物的原子中心官能团,并记录所述第一相邻原子的属性;抽取反应物的每个化学键的两端原子及与所述两端原子直接连键的第二相邻原子,获得所述反应物的化学键中心官能团,记录所述第二相邻原子的属性。
7.于本发明的一实施例中,所述根据所述反应物的各官能团计算所述设计化学反应的兼容性和反应性的一种实现过程包括:根据所述反应物的一官能团gi计算所述设计化学反应在官能团gi存在时的兼容性分数为:其中,r表示需要预测的所述设计化学反应的反应模板,p(r)表示反应数据库中属于r反应模板的化学反应出现的频率,p(gi)表示反应数据库中官能团gi出现的频率;根据所述反应物中的各官能团之集合g
计算的所述设计化学反应的兼容性分数为:p(r|g)=πp(r|gi),其中,g={g1,g2,
…gi
,

}表示反应物中的官能团集合,p(r|gi)表示所述设计化学反应在官能团gi存在时的兼容性分数,п表示对官能团集合g里每一个元素gi都进行该符号右边公式的计算并将结果连乘;根据一不存在于所述反应物中的官能团计算所述设计化学反应对于官能团的反应性分数为:其中,p(r)表示反应数据库中属于r反应模板的化学反应出现的频率,为所述r反应模板在官能团存在时的兼容性分数;表示反应数据库中官能团出现的频率;表示r反应模板的化学反应中官能团出现的频率;根据所述反应物中的反应位点附近的官能团之集合g及反应模板数据库中与所述反应模板相同类型反应的位点附近的官能团之集合gc计算所述设计化学反应的反应性分数为:其中,表示反应模板数据库中存在于属于r反应模板的化学反应的反应位点附近的官能团集合,表示官能团集合gc中的官能团不存在于所述反应物的反应位点附近;π表示对官能团集合gc里每一个元素都进行该符号右边公式的计算并将结果连乘;其中,反应位点的官能团集合附近可指包括但不限于距离反应位点图论距离为1,2的原子所属的官能团的集合。
8.于本发明的一实施例中,根据所述反应模板计算所述设计化学反应的选择性的一种实现过程包括:将所述反应模板应用于反应物以找到所有潜在的正向反应位点{sj};计算每个正向反应位点的可行性分数:其中,p(r|g)为根据所述反应物中的各官能团之集合g计算的所述设计化学反应的兼容性分数,为根据所述反应物中的反应位点附近的官能团之集合及反应模板数据库中属于所述推荐反应模板r的化学反应的反应位点附近的官能团之集合gc计算的所述设计化学反应的反应性分数;基于所有反应位点的可行性分数计算得到主位点s0的可行性分数:其中,f是反应可行性函数,f(s0)表示反应发生在位点s0时的可行性分数,f(s0|{sj})表示考虑到其他可能的反应位点的集合{sj},即将集合{sj}选择性纳入计算之后反应发生在位点s0时的可行性分数;潜在的正向反应位点{sj}即反应物中所有可能进行所述r反应模版的位点;所述主位点s0的可行性分数即为所述设计化学反应可行性的预测结果。
9.于本发明的一实施例中,所述化学反应可行性预测方法还包括:检索所述设计化学反应的相似反应;计算所述设计化学反应与所述相似反应的相似度;根据所述设计化学反应可行性的预测结果与所述相似度获得所述设计化学反应可行性的验证结果。
10.于本发明的一实施例中,所述检索所述设计化学反应的相似反应的一种实现过程包括:于一化学反应数据库中,基于搜索要素搜索与所述设计化学反应相同或相近的化学反应;所述搜索要素包括反应模板特征、反应位点特征、官能团特征或/和相似度特征;所述
反应模板特征包括反应模板id和扩展反应模板id;所述反应位点特征包括主位点特征和竞争位点特征;所述官能团特征包括原子中心官能团特征和化学键中心官能团特征;所述相似度特征包括但不限于原子及其邻接原子信息,原子数量,连键顺序,键级,环数,环的邻接关系等;计算搜索到的化学反应与所述设计化学反应的相似度为:
[0011][0012]
其中,将两组特征向量f和g分类为对称(f
sym
,g
sym
)和不对称(f
asym
,g
asym
)的两类;f表示设计化学反应的特征向量,g表示搜索到的化学反应的特征向量;fk表示多维特征向量f中的一维特征数据,gk表示多维特征向量g中的一维特征数据,即第k个搜索要素特征;θ为预设的权重参数。
[0013]
本发明还提供一种逆合成化学反应可行性预测方法,所述逆合成化学反应可行性预测方法包括:获取逆合成化学反应路径设计;所述逆合成化学反应路径设计包括至少1个逆合成化学反应步骤;获取所述逆合成化学反应步骤的设计化学反应的反应物与生成物;提取所述反应物的官能团和所述设计化学反应的反应模板;计算所述反应物的各官能团的兼容性和反应性;根据所述反应模板计算所述设计化学反应的选择性;根据所述兼容性、反应性和选择性评估获得所述设计化学反应可行性的预测结果;检索所述设计化学反应的相似反应;计算所述设计化学反应与所述相似反应的相似度;根据所述设计化学反应可行性的预测结果与所述相似度获得所述设计化学反应可行性的验证结果;根据各所述逆合成化学反应步骤的验证结果获得所述逆合成化学反应路径设计的可行性预测结果。
[0014]
本发明还提供一种化学反应可行性预测系统,所述化学反应可行性预测系统包括:化学反应输入模块,获取设计化学反应的反应物与生成物;反应官能团提取模块,与所述化学反应输入模块相连,提取所述反应物的官能团;反应模板提取模块,与所述化学反应输入模块相连,提取所述设计化学反应的反应模板;反应性计算模块,与所述反应官能团提取模块相连,根据所述反应物的各官能团计算所述设计化学反应的兼容性和反应性;选择性计算模块,与所述反应模板提取模块相连,根据所述反应模板计算所述设计化学反应的选择性;可行性预测模块,与所述反应性计算模块和所述选择性计算模块分别相连,根据所述兼容性、反应性和选择性评估获得所述设计化学反应可行性的预测结果。
[0015]
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述化学反应可行性预测方法的步骤或所述逆合成化学反应可行性预测方法的步骤。
[0016]
本发明还提供一种设备,所述设备包括:存储器,存储有一计算机程序;处理器,与所述存储器通信相连,调用执行所述计算机程序时实现所述逆合成化学反应可行性预测方法的步骤或所述逆合成化学反应可行性预测方法的步骤。
[0017]
如上所述,本发明所述的逆合成/化学反应可行性预测方法、系统、介质及设备,具有以下有益效果:
[0018]
本发明可以实现对逆合成路径设计步骤中每一步化学反应的可行性预测,进而能够评估系统自动生成的逆合成化学反应是否可行。此外,本发明还实现了高效的相似反应检索,能够在相似反应检索时考虑化合物的相似性及官能团的脆弱性,使得可行性预测结果符合实际情况,为系统的逆合成分析提高了可靠性,同时也为选取较优的逆合成路径提
供了实现的基础。
附图说明
[0019]
图1a显示为本发明实施例所述的化学反应可行性预测方法的一种实现流程示意图。
[0020]
图1b显示为本发明实施例所述的化学反应可行性预测方法的另一种实现流程示意图。
[0021]
图2a显示为本发明实施例所述的原子中心官能团的一种示例结构示意图。
[0022]
图2b显示为本发明实施例所述的化学键中心官能团的一种示例结构示意图。
[0023]
图3显示为本发明实施例所述的逆合成化学反应可行性预测方法的一种实现流程示意图。
[0024]
图4显示为本发明实施例所述的化学反应可行性预测系统的一种实现结构示意图。
[0025]
图5显示为本发明实施例所述的化学反应可行性预测系统的另一种实现结构示意图。
[0026]
元件标号说明
[0027]
400
ꢀꢀꢀꢀꢀꢀꢀꢀ
化学反应可行性预测系统
[0028]
410
ꢀꢀꢀꢀꢀꢀꢀꢀ
化学反应输入模块
[0029]
420
ꢀꢀꢀꢀꢀꢀꢀꢀ
反应官能团提取模块
[0030]
430
ꢀꢀꢀꢀꢀꢀꢀꢀ
反应模板提取模块
[0031]
440
ꢀꢀꢀꢀꢀꢀꢀꢀ
反应性计算模块
[0032]
450
ꢀꢀꢀꢀꢀꢀꢀꢀ
选择性计算模块
[0033]
460
ꢀꢀꢀꢀꢀꢀꢀꢀ
可行性预测模块
[0034]
470
ꢀꢀꢀꢀꢀꢀꢀꢀ
相似反应检索模块
[0035]
480
ꢀꢀꢀꢀꢀꢀꢀꢀ
相似度计算模块
[0036]
490
ꢀꢀꢀꢀꢀꢀꢀꢀ
可行性验证模块
[0037]
s101~s108 步骤
[0038]
s301~s310 步骤
具体实施方式
[0039]
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0040]
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
[0041]
在化学家进行逆合成分析的过程中,需要不断检查每个设计的反应的可行性。在进行自动逆合成路径设计的过程中,对于系统预测的反应,需要能够预测反应的可行性,以此过滤掉不可能发生的化学反应,提高生成路线的准确率。对于系统预测的反应,需要能快速找到能够证明此反应可行性的相似反应。基于上述需求,提出本技术。
[0042]
参见图1a所示,本发明实施例提供一种化学反应可行性预测方法,所述化学反应可行性预测方法包括:
[0043]
步骤s101,获取设计化学反应的反应物与生成物;
[0044]
步骤s102,提取所述反应物的官能团和所述设计化学反应的反应模板;
[0045]
步骤s103,根据所述反应物的各官能团计算所述设计化学反应的兼容性和反应性;
[0046]
步骤s104,根据所述反应模板计算所述设计化学反应的选择性;
[0047]
步骤s105,根据所述兼容性、反应性和选择性评估获得所述设计化学反应可行性的预测结果。
[0048]
参见图1b所示,于本发明一实施例中,所述化学反应可行性预测方法还包括:
[0049]
步骤s106,检索所述设计化学反应的相似反应;
[0050]
步骤s107,计算所述设计化学反应与所述相似反应的相似度;
[0051]
步骤s108,根据所述设计化学反应可行性的预测结果与所述相似度获得所述设计化学反应可行性的验证结果。
[0052]
本发明所述的化学反应可行性预测方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
[0053]
于本发明一实施例中,步骤s102中,所述提取所述反应物的官能团的一种实现过程包括:抽取与反应物的每个中心原子直接连键的第一相邻原子,获得所述反应物的原子中心官能团,并记录所述第一相邻原子的属性;抽取反应物的每个化学键的两端原子及与所述两端原子直接连键的第二相邻原子,获得所述反应物的化学键中心官能团,记录所述第二相邻原子的属性。
[0054]
其中,官能团是决定有机化合物的化学性质的原子或原子团。常见官能团有烯烃、醇、酚、醚、醛、酮等。有机化学反应主要发生在官能团上,官能团对有机物的性质起决定作用,-x、-oh、-cho、-cooh、-no2、-so3h、-nh2、rco-,这些官能团就决定了有机物中的卤代烃、醇或酚、醛、羧酸、硝基化合物或亚硝酸酯、磺酸类有机物、胺类、酰胺类的化学性质。
[0055]
进一步,为了确定化学反应的可行性,需要评估反应物中的官能团与所需反应条件的兼容性。本实施例采用自动抽取的官能团模板,基于两类图论结构:1)原子中心官能团;2)化学键中心官能团。其中,原子中心官能团是以原子为中心的官能团,对每个中心原子,抽取与其直接连键的相邻原子(即第一相邻原子),除碳外的所有重原子都被提取,如图2a所示化学键中心官能团是以化学键为中心的官能团,对每个化学键,抽取其两端原子及与该两端原子直接连键的相邻原子(即第二相邻原子),对所有非单键的化学键抽取,如图2b所示。抽取官能团中的原子时记录原子的如下属性:是否在芳香环上、是否与非sp3原子成键、是否位于环中等,以帮助区分稳定性和兼容性不同的官能团。
[0056]
于本发明一实施例中,步骤s103中,所述根据所述反应物的各官能团计算所述设
计化学反应的兼容性和反应性的一种实现过程包括:根据所述反应物的一官能团gi计算所述设计化学反应在官能团gi存在时的兼容性分数为:
[0057][0058]
其中,r表示需要预测的所述设计化学反应的反应模板,p(r)表示反应数据库中属于r反应模板的化学反应出现的频率,p(gi)表示反应数据库中官能团gi出现的频率;p(gi|r)表示r反应模板的化学反应中官能团gi出现的频率;
[0059]
根据所述反应物中的各官能团之集合g计算的所述设计化学反应的兼容性分数为:
[0060]
p(r|g)=πp(r|gi)
[0061]
其中,g={g1,g2,
…gi
,

}表示反应物中的官能团集合,p(r|gi)表示所述设计化学反应在官能团gi存在时的兼容性分数,π表示对官能团集合g里每一个元素gi都进行该符号右边公式的计算并将结果连乘;
[0062]
根据一不存在于所述反应物中的官能团计算所述设计化学反应对于官能团的反应性分数为:
[0063][0064]
其中,p(r)表示反应数据库中属于r反应模板的化学反应出现的频率,为所述r反应模板在官能团存在时的兼容性分数;表示反应数据库中官能团出现的频率;表示r反应模板的化学反应中官能团出现的频率;
[0065]
根据所述反应物中的反应位点附近的官能团之集合g及反应模板数据库中与所述反应模板相同类型反应的位点附近的官能团之集合gc计算所述设计化学反应的反应性分数为:
[0066][0067]
其中,表示反应模板数据库中存在于属于r反应模板的化学反应的反应位点附近的官能团集合,表示官能团集合gc中的官能团不存在于所述反应物的反应位点附近;π表示对官能团集合gc里每一个元素都进行该符号右边公式的计算并将结果连乘;其中,反应位点的官能团集合附近可指包括但不限于距离反应位点图论距离为1,2的原子所属的官能团的集合。
[0068]
本技术中,符号i为泛指,表示第i个,没有具体的物理含义。其中,r类别指与反应r具有相同反应模板的反应所属的类别,例如反应1的反应模板与反应r的反应模板相同,则反应1与反应r属于同类别反应,该类别可称为r类别。
[0069]
进一步,本发明的可行性分数中考虑了兼容性和反应性。本发明在计算兼容性时考虑了反应官能团在反应数据库内与预测的反应同类型的反应中出现的频率。若某一官能
团在预测的反应中出现而在反应数据库的同类反应中很少出现,说明系统预测的该反应存在问题。
[0070]
反应数据库即化学反应数据库,一般从现有文献资料或/和专利数据库提供的有实验证据的化学反应中整理提取,其中每个反应条目都包含反应物结构,生成物结构,反应条件,操作步骤等相关信息。所述化学反应数据库包括已验证过的可以发生化学反应的反应物、生成物及化学反应数据集。
[0071]
反应模板数据库由多种类型化学反应的反应模板和属于该类型的反应数据库中的反应条目组成。将化学反应过程发生键连和/或杂化情况变化的原子及其连键提取出来之后,把有着相同提取结果的反应聚类归为同一类型反应,反映该类型反应的原子及化学键变化的图论结构,即为反应模版。
[0072]
于本发明一实施例中,步骤s104中,根据所述反应模板计算所述设计化学反应的选择性的一种实现过程包括:
[0073]
将所述反应模板应用于反应物以找到所有潜在的正向反应位点{sj};
[0074]
计算每个正向反应位点的可行性分数:
[0075][0076]
其中,p(r|g)为根据所述反应物中的各官能团之集合g计算的所述设计化学反应的兼容性分数,为根据所述反应物中的反应位点附近的官能团之集合及反应模板数据库中属于所述推荐反应模板r的化学反应的反应位点附近的官能团之集合gc计算的所述设计化学反应的反应性分数;
[0077]
基于所有反应位点的可行性分数计算得到主位点s0的可行性分数:
[0078][0079]
其中,f是反应可行性函数,f(s0)表示反应发生在位点s0时的可行性分数,f(s0|{sj})表示考虑到其他可能的反应位点的集合{sj},即将集合{sj}选择性纳入计算之后反应发生在位点s0时的可行性分数;潜在的正向反应位点{sj}即反应物中所有可能进行所述r反应模版的位点;所述主位点s0的可行性分数即为所述设计化学反应可行性的预测结果。本技术中,符号j为泛指,表示第j个,没有具体的物理含义。
[0080]
于本发明一实施例中,步骤s106中,所述检索所述设计化学反应的相似反应的一种实现过程包括:于一化学反应数据库中,基于搜索要素搜索与所述设计化学反应相同或相近的化学反应;所述搜索要素包括反应模板特征、反应位点特征、官能团特征或/和相似度特征;所述反应模板特征包括反应模板id和扩展反应模板id;所述反应位点特征包括主位点特征和竞争位点特征;所述官能团特征包括原子中心官能团特征和化学键中心官能团特征;所述相似度特征包括但不限于原子及其邻接原子信息,原子数量,连键顺序,键级,环数,或/和环的邻接关系。
[0081]
于本发明一实施例中,步骤s107中,计算搜索到的化学反应与所述设计化学反应的相似度为:
[0082][0083]
其中,将两组特征向量f和g分类为对称(f
sym
,g
sym
)和不对称(f
asym
,g
asym
)的两类;f表示设计化学反应的特征向量,g表示搜索到的化学反应的特征向量;fk表示多维特征向量f中的一维特征数据,gk表示多维特征向量g中的一维特征数据,即第k个搜索要素特征;θ为预设的权重参数。其中,多维特征向量包括但不限于原子及其邻接原子信息,原子数量,连键顺序,键级,环数和环的邻接关系等维度的特征数据;所述一维特征数据即为原子及其邻接原子信息,原子数量,连键顺序,键级,环数和环的邻接关系中的任一个特征数据。本技术中,符号k为泛指,表示第k个,没有具体的物理含义。
[0084]
对于特征向量中的特征,分成两种情况:一种情况是,文献中的某个特征必须与所述设计化学反应中的完全一致,即不可多亦不可少,此种情况下为对称的特征向量;另一种情况是,文献中允许出现设计化学反应中不存在的特征,即可以多但不可以少;只在设计化学反应中有而文献中不存在此特征时才计算相似度惩罚;此种情况为不对称的特征向量。
[0085]
本发明在完成特征抽取后,使用倒排索引模块对文献中的所有反应进行建库,完善反应数据库,可以大幅提高后续检索的效率。
[0086]
本发明实现了准确的化学反应可行性评估,能够评估逆合成系统输出的反应是否可行,实现了高效的相似反应检索,能够在搜索时考虑化合物的相似性及官能团的脆弱性,提高了搜索的准确性。
[0087]
参见图3所示,本发明实施例还提供一种逆合成化学反应可行性预测方法,该方法阐述了整个逆合成化学反应路径设计的预测过程,其包括本发明实施例图1a和图1b所述的相关内容;所述逆合成化学反应可行性预测方法包括:
[0088]
s301,获取逆合成化学反应路径设计;所述逆合成化学反应路径设计包括至少1个逆合成化学反应步骤。
[0089]
s302,获取所述逆合成化学反应步骤的设计化学反应的反应物与生成物。
[0090]
s303,提取所述反应物的官能团和所述设计化学反应的反应模板。其中,所述提取所述反应物的官能团的一种实现过程包括:抽取与反应物的每个中心原子直接连键的第一相邻原子,获得所述反应物的原子中心官能团,并记录所述第一相邻原子的属性;抽取反应物的每个化学键的两端原子及与所述两端原子直接连键的第二相邻原子,获得所述反应物的化学键中心官能团,记录所述第二相邻原子的属性。
[0091]
s304,根据所述反应物的各官能团计算所述设计化学反应的兼容性和反应性。
[0092]
进一步,根据所述反应物的一官能团gi计算所述设计化学反应在官能团gi存在时的兼容性分数为:
[0093][0094]
其中,r表示需要预测的所述设计化学反应的反应模板,p(r)表示反应数据库中属于r反应模板的化学反应出现的频率,p(gi)表示反应数据库中官能团gi出现的频率;p(gi|r)表示r反应模板的化学反应中官能团gi出现的频率;
[0095]
根据所述反应物中的各官能团之集合g计算的所述设计化学反应的兼容性分数
为:
[0096]
p(r|g)=πp(r|gi)
[0097]
其中,g={g1,g2,
…gi
,

}表示反应物中的官能团集合,p(r|gi)表示所述设计化学反应在官能团gi存在时的兼容性分数,∏表示对官能团集合g里每一个元素gi都进行该符号右边公式的计算并将结果连乘;
[0098]
根据一不存在于所述反应物中的官能团计算所述设计化学反应对于官能团的反应性分数为:
[0099][0100]
其中,p(r)表示反应数据库中属于r反应模板的化学反应出现的频率,为所述r反应模板在官能团存在时的兼容性分数;表示反应数据库中官能团出现的频率;表示r反应模板的化学反应中官能团出现的频率;
[0101]
根据所述反应物中的反应位点附近的官能团之集合g及反应模板数据库中与所述反应模板相同类型反应的位点附近的官能团之集合gc计算所述设计化学反应的反应性分数为:
[0102][0103]
其中,表示反应模板数据库中存在于属于r反应模板的化学反应的反应位点附近的官能团集合,表示官能团集合gc中的官能团不存在于所述反应物的反应位点附近;п表示对官能团集合gc里每一个元素都进行该符号右边公式的计算并将结果连乘;其中,反应位点的官能团集合附近可指包括但不限于距离反应位点图论距离为1,2的原子所属的官能团的集合。
[0104]
s305,根据所述反应模板计算所述设计化学反应的选择性。其中,根据所述反应模板计算所述设计化学反应的选择性的一种实现过程包括:
[0105]
将所述反应模板应用于反应物以找到所有潜在的正向反应位点{sj};
[0106]
计算每个正向反应位点的可行性分数:
[0107][0108]
其中,p(r|g)为根据所述反应物中的各官能团之集合g计算的所述设计化学反应的兼容性分数,为根据所述反应物中的反应位点附近的官能团之集合及反应模板数据库中属于所述推荐反应模板r的化学反应的反应位点附近的官能团之集合gc计算的所述设计化学反应的反应性分数;
[0109]
基于所有反应位点的可行性分数计算得到主位点s0的可行性分数:
[0110][0111]
其中,f是反应可行性函数,f(s0)表示反应发生在位点s0时的可行性分数,f(s0|{sj})表示考虑到其他可能的反应位点的集合{sj},即将集合{sj}选择性纳入计算之后反应发生在位点s0时的可行性分数;潜在的正向反应位点{sj}即反应物中所有可能进行所述r反应模版的位点;所述主位点s0的可行性分数即为所述设计化学反应可行性的预测结果。本技术中,符号j为泛指,表示第j个,没有具体的物理含义。
[0112]
s306,根据所述兼容性、反应性和选择性评估获得所述设计化学反应可行性的预测结果。
[0113]
s307,检索所述设计化学反应的相似反应。进一步,基于搜索要素搜索与所述设计化学反应相同或相近的化学反应;所述搜索要素包括反应模板特征、反应位点特征、官能团特征或/和相似度特征;所述反应模板特征包括反应模板id和扩展反应模板id;所述反应位点特征包括主位点特征和竞争位点特征;所述官能团特征包括原子中心官能团特征和化学键中心官能团特征;所述相似度特征包括但不限于原子及其邻接原子信息,原子数量,连键顺序,键级,环数,或/和环的邻接关系。
[0114]
s308,计算所述设计化学反应与所述相似反应的相似度。其中,计算搜索到的化学反应与所述设计化学反应的相似度为:
[0115][0116]
其中,将两组特征向量f和g分类为对称(f
sym
,g
sym
)和不对称(f
asym
,g
asym
)的两类;f表示设计化学反应的特征向量,g表示搜索到的化学反应的特征向量;fk表示多维特征向量f中的一维特征数据,gk表示多维特征向量g中的一维特征数据,即第k个搜索要素特征;θ为预设的权重参数。
[0117]
s309,根据所述设计化学反应可行性的预测结果与所述相似度获得所述设计化学反应可行性的验证结果。
[0118]
s310,根据各所述逆合成化学反应步骤的验证结果获得所述逆合成化学反应路径设计的可行性预测结果。
[0119]
本发明所述的逆合成化学反应可行性预测方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
[0120]
本发明还提供一种化学反应可行性预测系统,所述化学反应可行性预测系统可以实现本发明所述的化学反应可行性预测方法,但本发明所述的化学反应可行性预测方法的实现装置包括但不限于本实施例列举的化学反应可行性预测系统的结构,凡是根据本发明的原理所做的现有技术的结构变形和替换,都包括在本发明的保护范围内。
[0121]
参见图4所示,本发明实施例还提供一种化学反应可行性预测系统,所述化学反应可行性预测系统400包括:化学反应输入模块410,反应官能团提取模块420,反应模板提取模块430,反应性计算模块440,选择性计算模块450,可行性预测模块460。
[0122]
所述化学反应输入模块410获取设计化学反应的反应物与生成物。
[0123]
所述反应官能团提取模块420与所述化学反应输入模块410相连,提取所述反应物的官能团。所述反应官能团提取模块420抽取与反应物的每个中心原子直接连键的第一相邻原子,获得所述反应物的原子中心官能团,并记录所述第一相邻原子的属性;抽取反应物的每个化学键的两端原子及与所述两端原子直接连键的第二相邻原子,获得所述反应物的化学键中心官能团,记录所述第二相邻原子的属性。
[0124]
所述反应模板提取模块430与所述化学反应输入模块410相连,提取所述设计化学反应的反应模板。
[0125]
所述反应性计算模块440与所述反应官能团提取模块420相连,计算所述反应物的各官能团的兼容性和反应性。所述反应性计算模块440根据所述反应物的一官能团gi计算所述设计化学反应在官能团gi存在时的兼容性分数为:
[0126][0127]
其中,r表示需要预测的所述设计化学反应的反应模板,p(r)表示反应数据库中属于r反应模板的化学反应出现的频率,p(gi)表示反应数据库中官能团gi出现的频率;p(gi|r)表示r反应模板的化学反应中官能团gi出现的频率。
[0128]
所述反应性计算模块440根据所述反应物中的各官能团之集合g计算的所述设计化学反应的兼容性分数为:
[0129]
p(r|g)=πp(r|gi)
[0130]
其中,g={g1,g2,
…gi
,

}表示反应物中的官能团集合,p(r|gi)表示所述设计化学反应在官能团gi存在时的兼容性分数,∏表示对官能团集合g里每一个元素gi都进行该符号右边公式的计算并将结果连乘。
[0131]
所述反应性计算模块440根据一不存在于所述反应物中的官能团计算所述设计化学反应对于官能团的反应性分数为:
[0132][0133]
其中,p(r)表示反应数据库中属于r反应模板的化学反应出现的频率,为所述r反应模板在官能团存在时的兼容性分数;表示反应数据库中官能团出现的频率;表示r反应模板的化学反应中官能团出现的频率。
[0134]
所述反应性计算模块440根据所述反应物中的反应位点附近的官能团之集合g及反应模板数据库中与所述反应模板相同类型反应的位点附近的官能团之集合gc计算所述设计化学反应的反应性分数为:
[0135][0136]
其中,表示反应模板数据库中存在于属于r反应模板的化学反应的反应位点附近的官能团集合,表示官能团集合gc中的官能团不存在于所述反应物
的反应位点附近;∏表示对官能团集合gc里每一个元素都进行该符号右边公式的计算并将结果连乘;其中,反应位点的官能团集合附近可指包括但不限于距离反应位点图论距离为1,2的原子所属的官能团的集合。
[0137]
所述选择性计算模块450与所述反应模板提取模块430相连,根据所述反应模板计算所述设计化学反应的选择性。所述选择性计算模块450将所述反应模板应用于反应物以找到所有潜在的正向反应位点{sj};计算每个正向反应位点的可行性分数:其中,p(r|g)为根据所述反应物中的各官能团之集合g计算的所述设计化学反应的兼容性分数,为根据所述反应物中的反应位点附近的官能团之集合及反应模板数据库中属于所述推荐反应模板r的化学反应的反应位点附近的官能团之集合gc计算的所述设计化学反应的反应性分数;基于所有反应位点的可行性分数计算得到主位点s0的可行性分数:其中,f是反应可行性函数,f(s0)表示反应发生在位点s0时的可行性分数,f(s0|{sj})表示考虑到其他可能的反应位点的集合{sj},即将集合{sj}选择性纳入计算之后反应发生在位点s0时的可行性分数;潜在的正向反应位点{sj}即反应物中所有可能进行所述r反应模版的位点;所述主位点s0的可行性分数即为所述设计化学反应可行性的预测结果。本技术中,符号j为泛指,表示第j个,没有具体的物理含义。
[0138]
将所述反应模板应用于反应物以找到所有潜在的正向反应位点{sj};计算每个反应位点的可行性分数f(sj);基于所有反应位点的可行性分数计算得到主位点s0的可行性分数:其中,f是反应可行性函数,f(s0)表示反应发生在位点s0时的可行性分数,f(s0|{sj})表示考虑到其他可能的反应位点的集合{sj},即将选择性纳入计算之后反应发生在位点s0时的可行性分数;潜在的正向反应位点{sj}即反应物中所有可能进行所述反应模版的位点,主位点s0为计算最终考虑到选择性的可行性分数的位点。所述主位点的可行性分数即可体现所述设计化学反应可行性的预测结果。
[0139]
所述可行性预测模块460与所述反应性计算模块440和所述选择性计算模块450分别相连,根据所述兼容性和选择性评估获得所述设计化学反应可行性的预测结果。
[0140]
参见图5所示,所述化学反应可行性预测系统400还包括:相似反应检索模块470,相似度计算模块480,可行性验证模块490。
[0141]
所述相似反应检索模块470与所述反应模板提取模块430通信相连,基于反应数据库检索所述设计化学反应的相似反应。进一步,基于搜索要素搜索与所述设计化学反应相同或相近的化学反应;所述搜索要素包括反应模板特征、反应位点特征、官能团特征或/和相似度特征;所述反应模板特征包括反应模板id和扩展反应模板id;所述反应位点特征包括主位点特征和竞争位点特征;所述官能团特征包括原子中心官能团特征和化学键中心官能团特征;所述相似度特征包括但不限于原子及其邻接原子信息,原子数量,连键顺序,键级,环数,或/和环的邻接关系。
[0142]
所述相似度计算模块480与所述相似反应检索模块470通信相连,计算所述设计化学反应与所述相似反应的相似度。其中,计算搜索到的化学反应与所述设计化学反应的相似度为:
[0143][0144]
其中,将两组特征向量f和g分类为对称(f
sym
,g
sym
)和不对称(f
asym
,g
asym
)的两类;f表示设计化学反应的特征向量,g表示搜索到的化学反应的特征向量;fk表示多维特征向量f中的一维特征数据,gk表示多维特征向量g中的一维特征数据,即第k个搜索要素特征;θ为预设的权重参数。
[0145]
所述可行性验证模块490与所述可行性预测模块460和所述相似度计算模块480分别通信相连,根据所述设计化学反应可行性的预测结果与所述相似度获得所述设计化学反应可行性的验证结果。
[0146]
需要说明的是,应理解以上系统的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现,也可以全部以硬件的形式实现,还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如:x模块可以为单独设立的处理元件,也可以集成在上述系统的某一个芯片中实现。此外,x模块也可以以程序代码的形式存储于上述系统的存储器中,由上述系统的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
[0147]
本发明还提供一种设备,所述设备包括:存储器,存储有一计算机程序;处理器,与所述存储器通信相连,调用执行所述计算机程序时实现所述逆合成化学反应可行性预测方法的步骤或所述逆合成化学反应可行性预测方法的步骤。
[0148]
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明所述的化学反应可行性预测方法的步骤或逆合成化学反应可行性预测方法的步骤。
[0149]
本技术所描述的计算机程序可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。
[0150]
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
[0151]
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献