一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

交互式/化学合成路线设计方法、系统、介质及电子设备与流程

2022-06-11 06:32:03 来源:中国专利 TAG:


1.本发明属于计算机化学技术领域,涉及一种化学合成路线设计方法,特别是涉及一种交互式/化学合成路线设计方法、系统、介质及电子设备。


背景技术:

2.化学合成是通过化学反应生成所需化合物的过程。化学合成始于原料和试剂的选择。各种化学反应可用于获得目标产物。对于将化合物a转化为产物b的过程,可以考虑各种途径,这被称为“合成策略”。在多阶段反应中,在一个基质上连续进行化学转化,在多组分反应中,从多种反应物中获得一种产物。
3.有两种表示产品数量的方法,一种是以质量表示的产率,另一种是表示为从原料获得的理论量的百分比的产率。在由简单化合物制备复杂化合物的过程中,需要多步操作以及大量时间和劳力,直到合成目标产物。因此,如何快速获得准确可行的化合物合成路线就是本发明亟待解决的问题。


技术实现要素:

4.鉴于以上所述现有技术的缺点,本发明的目的在于提供一种交互式/化学合成路线设计方法、系统、介质及电子设备,用于快速得到准确可行的化合物合成路线。
5.为实现上述目的及其他相关目的,本发明提供一种交互式化学合成路线设计方法,所述交互式化学合成路线设计方法包括:获得一化合物;根据一预设筛选条件对所述化合物进行逐步逆合成处理,获得所述化合物的化学合成路线;获得一偏好筛选条件;根据所述偏好筛选条件对所述逆合成处理中的某一步进行更新处理,并基于所述偏好筛选条件和所述预设筛选条件对所述逆合成处理中的某一步的后续步骤进行更新处理。
6.于本发明的一实施例中,所述根据一预设筛选条件对所述化合物进行逐步逆合成处理的一种实现过程包括:于一反应模板库中搜索匹配所述化合物的逆合成反应模板;基于各所述逆合成反应模板获得对应的所述化合物的反应前体;选择符合所述预设筛选条件的反应前体及对应的逆合成反应模板作为所述化合物的化学合成路线设计的一步;若所述反应前体为需逆合成的化合物,则对所述需逆合成的化合物重复上述处理,直至获得的反应前体为无需逆合成的化合物,至此实现所述化合物的化学合成路线设计的全部步骤。
7.于本发明的一实施例中,所述于一反应模板库中搜索匹配所述化合物的逆合成反应模板的一种实现过程包括:所述化合物被量化为分子图g(v,e),顶点v对应于原子,边e对应于键;所述反应模板库中的每个反应模板在其反应物与生成物中对应原子添加虚拟化学键之后被量化为连通图g(v,e);基于图卷积的方法于所述反应模板库中搜索最佳的逆合成反应模板,包括:根据所述化合物的分子图g(v,e)计算所述化合物的嵌入向量为:
[0008][0009]
[0010]
其中,k表示卷积网络总层数,化合物的嵌入向量c由化合物中的每个原子的最高层即第k层嵌入聚合而成;wk为第k层的神经网络参数矩阵,p
i,j
是化合物中的原子i和j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定长度向量的聚合函数;concat{
·
}表示向量连接操作;为化合物c中的第i个原子的第k层嵌入;
[0011]
根据所述反应模板的连通图g(v,e)计算所述反应模板库中的各逆合成反应模板的嵌入向量为t:
[0012][0013][0014]
其中,k表示卷积网络总层数,反应模板的嵌入向量t由反应模板中每个原子的最高层即第k层嵌入聚合而成;wk为第k层的神经网络参数矩阵,p
i,j
是反应模板中的原子i和j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定长度向量的聚合函数;concat{
·
}表示向量连接操作;为反应模板中的第i个原子的第k层嵌入;
[0015]
根据各所述逆合成反应模板的推荐分数pm=c
·
tm由高到低的顺序输出推荐的逆合成反应模板,tm为反应模板库中的第m个反应模板的嵌入;m为大于或等于1的正整数。
[0016]
于本发明的一实施例中,所述预设筛选条件包括合成成本;化合物c的合成成本为cost(c):如果化合物c可购买到,成本为cost(c)=1;如果化合物c的合成方法尚未搜索过,则估计其成本为λ-sa(c)
,其中λ为参数,可预设为0.4;sa(c)为对于未知路线的化合物c估计合成所需的反应步骤数;如果化合物c的合成方法已经搜索过,设其已知的单步合成方法共由n种,pi={p
ij
}表示第i种合成方法的所有前体集合,yi表示第i种合成方式的估计产率,则化合物c的合成成本为n种合成方法中代价最低的合成方式,即:
[0017][0018]
于本发明的一实施例中,所述对于未知路线的化合物c估计合成所需的反应步骤数sa(c)的一种实现过程包括:对化合物c中的各要素预先设定合成步骤数;所述各要素的合成步骤数之和为反应步骤数sa(c);其中,所述各要素包括原子类型及个数、官能团类型及个数、长碳链长度和环个数及类型;所述原子类型及个数包括碳原子个数和杂原子个数;所述官能团类型及个数包括羰基、羧基、羟基、氰基、酰胺、或/和酰氯;所述环个数及类型包括芳香环、杂环、环大小及并环个数。
[0019]
于本发明的一实施例中,根据所述偏好筛选条件对所述逆合成处理中的某一步进行更新处理的一种实现过程包括:所述偏好筛选条件包括偏好特定路线;根据所述偏好特定路线将所述化学合成路线中的某一步指定为使用特定的逆合成反应模板完成。
[0020]
于本发明的一实施例中,根据所述偏好筛选条件对所述逆合成处理中的某一步进行更新处理的一种实现过程包括:所述偏好筛选条件包括禁用特定路线;所述禁用特定路线为禁止所述化学合成路线中出现某一不合适的反应;根据所述禁用特定路线对所述化学
合成路线中出现的某一不合适反应进行禁用,并根据所述预设筛选条件对出现所述某一不合适反应的步骤进行逆合成反应替换。
[0021]
本发明还提供一种化学合成路线设计方法,包括:获得一化合物;根据一预设筛选条件对所述化合物进行逐步逆合成处理,获得所述化合物的化学合成路线,包括:于一反应模板库中搜索匹配所述化合物的逆合成反应模板;基于各所述逆合成反应模板获得对应的所述化合物的反应前体;选择符合所述预设筛选条件的反应前体及对应的逆合成反应模板作为所述化合物的化学合成路线设计的一步;若所述反应前体为需逆合成的化合物,则对所述需逆合成的化合物重复上述处理,直至获得的反应前体为无需逆合成的化合物,至此实现所述化合物的化学合成路线设计的全部步骤。
[0022]
本发明还提供一种交互式化学合成路线设计系统,所述交互式化学合成路线设计系统包括:输入模块,获得一化合物;逆合成处理模块,与所述输入模块通信相连,根据一预设筛选条件对所述化合物进行逐步逆合成处理,获得所述化合物的化学合成路线;交互模块,获得一偏好筛选条件;逆合成更新模块,与所述交互模块和所述逆合成处理模块分别通信相连,根据所述偏好筛选条件对所述逆合成处理中的某一步进行更新处理,并基于所述偏好筛选条件和所述预设筛选条件对所述逆合成处理中的某一步的后续步骤进行更新处理。
[0023]
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述交互式化学合成路线设计方法的步骤或实现所述化学合成路线设计方法的步骤。
[0024]
本发明还提供一种电子设备,所述电子设备包括:存储器,存储有计算机程序;处理器,与所述存储器通信相连,调用所述计算机程序时实现所述交互式化学合成路线设计方法的步骤或实现所述化学合成路线设计方法的步骤。
[0025]
如上所述,本发明所述的交互式/化学合成路线设计方法、系统、介质及电子设备,具有以下有益效果:
[0026]
本发明可以自动化的完成小分子的化学合成路线设计,同时允许化学合成专家与系统进行交互,使得系统能够利用专家的专业知识,在短时间内不断迭代得到准确可行的化学合成路线。
附图说明
[0027]
图1显示为本发明实施例所述的交互式化学合成路线设计方法的一种实现流程示意图。
[0028]
图2显示为本发明实施例所述的交互式化学合成路线设计方法步骤s102的一种实现流程示意图。
[0029]
图3a显示为本发明实施例所述的在单次迭代中对目标化合物的探索过程示意图。
[0030]
图3b显示为本发明实施例所述的包含五次迭代的完整路径搜索过程示意图。
[0031]
图4显示为本发明实施例所述的化学合成路线设计方法的一种示例性流程示意图。
[0032]
图5显示为本发明实施例所述的化学合成路线设计方法的一种实现流程示意图。
[0033]
图6显示为本发明实施例所述的交互式化学合成路线设计系统的一种实现结构示
意图。
[0034]
图7显示为本发明实施例所述的化学合成路线设计系统的一种实现结构示意图。
[0035]
图8显示为本发明实施例所述的电子设备的一种实现结构示意图。
[0036]
元件标号说明
[0037]
600
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
交互式化学合成路线设计系统
[0038]
610
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
输入模块
[0039]
620
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
逆合成处理模块
[0040]
630
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
交互模块
[0041]
640
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
逆合成更新模块
[0042]
700
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
化学合成路线设计系统
[0043]
710
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
输入模块
[0044]
720
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
逆合成处理模块
[0045]
800
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
电子设备
[0046]
810
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
存储器
[0047]
820
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
处理器
[0048]
s101~s104
ꢀꢀꢀ
步骤
[0049]
s201~s204
ꢀꢀꢀ
步骤
[0050]
s401~s410
ꢀꢀꢀ
步骤
[0051]
s510~s524
ꢀꢀꢀ
步骤
具体实施方式
[0052]
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0053]
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
[0054]
请参阅图1,本发明提供一种交互式化学合成路线设计方法,所述交互式化学合成路线设计方法包括:
[0055]
s101,获得一化合物;
[0056]
s102,根据一预设筛选条件对所述化合物进行逐步逆合成处理,获得所述化合物的化学合成路线;
[0057]
s103,获得一偏好筛选条件;
[0058]
s104,根据所述偏好筛选条件对所述逆合成处理中的某一步进行更新处理,并基于所述偏好筛选条件和所述预设筛选条件对所述逆合成处理中的某一步的后续步骤进行更新处理。
[0059]
本实施例可以自动化的完成小分子的化学合成路线设计,同时允许化学合成专家与系统进行交互,使得系统能够利用专家的专业知识,在短时间内不断迭代得到准确可行的化学合成路线。其中,小分子意指化学合成药物,与大分子药物中的大分子相对应。大分子药物如多肽、聚糖、核酸、蛋白质等一般通过生物手段合成获得,而制药界通过化学合成的药物即为小分子药物。一般而言,小分子的分子量在900道尔顿以下,物理尺寸在1nm以下;小分子药物可以与生物大分子靶点结合从而达到调控效果。
[0060]
参见图2所示,于本发明的一实施例中,所述步骤s102根据一预设筛选条件对所述化合物进行逐步逆合成处理的一种实现过程包括:
[0061]
s201,于一反应模板库中搜索匹配所述化合物的逆合成反应模板。其中,所述逆合成反应模板简称反应模板。
[0062]
s202,基于各所述逆合成反应模板获得对应的所述化合物的反应前体;
[0063]
s203,选择符合所述预设筛选条件的反应前体及对应的逆合成反应模板作为所述化合物的化学合成路线设计的一步;
[0064]
s204,若所述反应前体为需逆合成的化合物,则对所述需逆合成的化合物重复上述处理,直至获得的反应前体为无需逆合成的化合物,至此实现所述化合物的化学合成路线设计的全部步骤。
[0065]
于本发明的一实施例中,步骤s201所述于一反应模板库中搜索匹配所述化合物的逆合成反应模板的一种实现过程包括:
[0066]
所述化合物被量化为分子图g(v,e),顶点v对应于原子,边e对应于键;所述反应模板库中的每个反应模板在其反应物与生成物中对应原子添加虚拟化学键之后被量化为连通图g(v,e),顶点v对应于原子,边e对应于键或/和虚拟化学键;
[0067]
基于图卷积的方法于所述反应模板库中搜索最佳的逆合成反应模板,包括:
[0068]
根据所述化合物的分子图g(v,e)计算所述化合物的嵌入向量为:
[0069][0070][0071]
其中,k表示卷积网络总层数,化合物的嵌入向量c由化合物中的每个原子的最高层即第k层嵌入聚合而成;wk为第k层的神经网络参数矩阵,p
i,j
是化合物中的原子i和j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定长度向量的聚合函数;concat{
·
}表示向量连接操作;为所述化合物中的第i个原子(即所述化合物的分子图g(v,e)中的第i个顶点)的第k层嵌入;
[0072]
根据所述反应模板的连通图g(v,e)计算所述反应模板库中的各逆合成反应模板的嵌入向量为t:
[0073][0074][0075]
其中,k表示卷积网络总层数,反应模板的嵌入向量t由反应模板中每个原子的最高层即第k层嵌入聚合而成;wk为第k层的神经网络参数矩阵,p
i,j
是反应模板中的原子i和j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定
长度向量的聚合函数;concat{
·
}表示向量连接操作;为所述反应模板中的第i个原子(即所述反应模板的连通图g(v,e)中的第i个顶点)的第k层嵌入;
[0076]
根据各所述逆合成反应模板的推荐分数pm=c
·
tm由高到低的顺序输出推荐的逆合成反应模板,tm为反应模板库中的第m个反应模板的嵌入,m为大于或等于1的正整数。
[0077]
于本发明的一实施例中,步骤s102所述的预设筛选条件包括合成成本;
[0078]
化合物c的合成成本为cost(c):
[0079]
如果化合物c可购买到,成本为cost(c)=1;
[0080]
如果化合物c的合成方法尚未搜索过,则估计其成本为λ-sa(c)
,其中λ为参数,可预设为0.4;sa(c)为对于未知路线的化合物c估计合成所需的反应步骤数;
[0081]
如果化合物c的合成方法已经搜索过,设其已知的单步合成方法共由n种,pi={p
ij
}表示第i种合成方法的所有前体集合,yi表示第i种合成方式的估计产率,则化合物c的合成成本为n种合成方法中代价最低的合成方式,即:
[0082][0083]
进一步,所述对于未知路线的化合物c估计合成所需的反应步骤数sa(c)的一种实现过程包括:对化合物c中的各要素预先设定合成步骤数;所述各要素的合成步骤数之和为反应步骤数sa(c);其中,所述各要素包括原子类型及个数、官能团类型及个数、长碳链长度和环个数及类型;所述原子类型及个数包括碳原子个数和杂原子个数;所述官能团类型及个数包括羰基、羧基、羟基、氰基、酰胺、或/和酰氯;所述环个数及类型包括芳香环、杂环、环大小及并环个数。
[0084]
具体地,反应推荐模块是逆合成设计方法的基础。对于给定的化合物,反应推荐模块使用基于图卷积的方法搜索最佳的逆合成反应模板(或简称反应模板)。只有当化合物的反应位点能与反应模板完全兼容时,才应用反应模板得到反应的前体。此实现严格确保反应位点与反应模板兼容,并能够通过离散的反应模板使用反应可行性预测器。
[0085]
反应推荐模块基于图卷积神经网络实现,其输入的化合物首先被量化为分子图g(v,e),顶点v对应于原子,边e对应于键;所述反应模板库中的每个反应模板在其反应物与生成物中对应原子添加虚拟化学键之后被量化为连通图g(v,e)。初始原子嵌入是通过原子元素的嵌入层定义的。每个图卷积层都由化合物中的每个原子及其成键原子的嵌入集合组成:
[0086][0087]
其中,wk为第k层的神经网络参数矩阵,p
i,j
是化合物中原子i和原子j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定长度向量的聚合函数,concat{
·
}表示向量连接操作,作用是将多个输入向量连接为一个向量方便后续处理;为所述化合物中的第i个原子(即所述化合物的分子图g(v,e)中的第i个顶点)的第k层嵌入。最终根据所述化合物的分子图g(v,e)计算所述化合物的嵌入向量为:
[0088]
[0089]
其中,k表示卷积网络总层数,化合物的嵌入向量c由化合物中的每个原子的最高层(第k层,k的大小因输入化合物不同而不同)嵌入聚合而成;v表示化合物的原子集合。
[0090]
反应模板库中的反应模板包括反应物、生成物及其原子之间的对应关系。对系统中每个已知的反应模板,将反应物和生成物之间的对应原子用虚拟的化合键连接得到类似输入化合物的连通图g(v,e),再用图卷积神经网络计算该反应模板的嵌入向量t。
[0091]
类似地,反应模板中的第i个原子(即所述反应模板的连通图g(v,e)中的第i个顶点)的第k层嵌入为
[0092][0093]
其中,wk为第k层的神经网络参数矩阵,p
i,j
是反应模板中原子i和原子j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定长度向量的聚合函数,concat{
·
}表示向量连接操作,作用是将多个输入向量连接为一个向量方便后续处理。最终根据所述反应模板的连通图g(v,e)计算所述反应模板库中的各逆合成反应模板的嵌入向量为t:
[0094][0095]
其中,k表示卷积网络总层数,反应模板的嵌入向量t由反应模板中每个原子的最高层(第k层,k的大小因输入化合物不同而不同)嵌入聚合而成;v表示反应模板的原子集合。
[0096]
设输入化合物的嵌入向量为c,编号为m的反应模板嵌入向量为tm,该反应模板的推荐分数计算为这两个向量的点积:pm=c
·
tm,tm为反应模板库中的第m个反应模板的嵌入,m为大于或等于1的正整数。
[0097]
推荐模块对输入的化合物,枚举所有已知的反应模板计算推荐分数,并对分数pm排序后,根据由高到低的顺序输出推荐的反应模板。
[0098]
逆合成规划过程使用基于有向无环图(dag)的搜索算法来有效地搜索合成空间。如图3a所示,在单次迭代中对目标化合物的探索,将兼容的反应模板应用于分子以产生其可能的前体。每个反应的成本由化合物复杂度估计器和反应可行性得分估计获得。然后选择成本最低的步骤,并将更新后的成本沿图中的合成路径反馈给其他化合物。
[0099]
复杂度估计器sa(c)对于一个未知路线的分子c估计合成所需的反应步骤数。估计方法为对化合物中的下列要素进行统计:
[0100]
1)原子类型及个数,包括碳原子个数和杂原子个数;
[0101]
2)官能团类型及个数,包括羰基、羧基、羟基、氰基、酰胺、酰氯等;
[0102]
3)长碳链长度;
[0103]
4)环个数及类型,包括芳香环和杂环,环大小及并环个数。
[0104]
对每个要素,事先设定了该要素估计的合成步骤数,最终各要素之和即为化合物的合成代价估计。
[0105]
对于一条路径上的每个化合物c,以如下方法估计合成成本cost(c):
[0106]
如果化合物c可购买到,成本为1;
[0107]
如果化合物c的合成方法尚未搜索过,则估计其成本为λ-sa(c)
,其中λ为参数,可预设为0.4;
[0108]
如果化合物c的合成方法已经搜索过,设其已知的单步合成方法共由n种,pi={p
ij
}表示第i种合成方法的所有前体集合,yi表示第i种合成方式的估计产率,则其合成成本估计为所有方法中代价最低的合成方式,即:
[0109][0110]
路径规划模块的最终目标是对要求的最终产物x,找到一条合成路线,使得cost(x)尽可能小。定义costreduction(c)为将化合物c的合成代价cost(c)强制设置为1时,cost(x)的减少量。则规划时每次选择costreduction(c)最大的化合物c进行扩展(即进行下一步逆合成处理)。
[0111]
图3b展示了一个包含五次迭代的完整路径搜索过程。每次迭代都会在其相应的方框中扩展该化合物。在搜索过程中,更新后的成本可能会在每次迭代后改变所有扩展方向的优先级,如迭代4(iter4)所示,通过此方式可以选择其他途径中未被深入探索的化合物。成本估计器有时会在搜索早期过高或过低的估计化合物的合成成本。通过不断迭代的方式,可以在规划中途修正错误的估计。在迭代4之后,新路径的成本被更新为高于原始路径,因此迭代5(iter5)在原始路径上执行,通过找到两个可购买的前体化合物来完成路径。完整的计算方法参见图4所示,包括:
[0112]
s401,输入目标化合物m;
[0113]
s402,将m加入化合物合集s;
[0114]
s403,在s中寻找当前最佳合成路线r
cb

[0115]
s404,找寻r
cb
中最复杂的待合成分子ce;
[0116]
s405,对ce使用反应推荐器推荐多个反应模板及其对应前体化合物re;
[0117]
s406,将中的所有化学反应的前体化合物加入到集合s;
[0118]
s407,判断是否达到预定迭代次数?若否,则返回步骤s403;
[0119]
s408,若是,则判断s中是否存在从可购买化合物起始的完整路线?
[0120]
s409,若是,则输出s中的合成路线;
[0121]
s410,若否,则输出未找到合成路线。
[0122]
于本发明的一实施例中,步骤s104所述的根据所述偏好筛选条件对所述逆合成处理中的某一步进行更新处理的一种实现过程包括:所述偏好筛选条件包括偏好特定路线;根据所述偏好特定路线将所述化学合成路线中的某一步指定为使用特定的逆合成反应模板完成。
[0123]
于本发明的一实施例中,步骤s104所述的根据所述偏好筛选条件对所述逆合成处理中的某一步进行更新处理的一种实现过程包括:所述偏好筛选条件包括禁用特定路线;所述禁用特定路线为禁止所述化学合成路线中出现某一不合适的反应;根据所述禁用特定路线对所述化学合成路线中出现的某一不合适反应进行禁用,并根据所述预设筛选条件对出现所述某一不合适反应的步骤进行逆合成反应替换。
[0124]
用户在浏览完系统提供的合成路线之后,可以向系统输入对路径的偏好信息(即偏好筛选条件),系统会利用此信息对合成路径进行迭代优化。例如,可以输入的偏好信息包括:
[0125]
1)偏好特定路线:用户可以指定路径中的某一步骤使用特定的反应完成,此时进行重新迭代计算时,系统将会强制使用这一步骤并重新完成后续逆合成步骤的规划。
[0126]
2)禁用特定路线:当用户认为路径中的某一步骤不合适时,可以指定禁止这一步骤出现。系统会记录迭代过程中所有用户指定的不合适步骤。在进行路径规划时,由系统中的反应相似度评估模块将设计的步骤与所有用户指定的不合适步骤进行相似度比较。对相似步骤的反应可行性打分进行惩罚,再重新完成整个路径规划。
[0127]
本发明所述的交互式化学合成路线设计方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
[0128]
参见图5所示,本发明实施例还提供一种化学合成路线设计方法,包括:
[0129]
s510,获得一化合物;
[0130]
s520,根据一预设筛选条件对所述化合物进行逐步逆合成处理,获得所述化合物的化学合成路线,包括:
[0131]
s521,于一反应模板库中搜索匹配所述化合物的逆合成反应模板;其中,所述逆合成反应模板简称反应模板。
[0132]
于本发明的一实施例中,步骤s201所述于一反应模板库中搜索匹配所述化合物的逆合成反应模板的一种实现过程包括:
[0133]
所述化合物被量化为分子图g(v,e),顶点v对应于原子,边e对应于键;所述反应模板库中的每个反应模板在其反应物与生成物中对应原子添加虚拟化学键之后被量化为连通图g(v,e);
[0134]
基于图卷积的方法于所述反应模板库中搜索最佳的逆合成反应模板,包括:
[0135]
根据所述化合物的分子图g(v,e)计算所述化合物的嵌入向量为:
[0136][0137][0138]
其中,k表示卷积网络总层数,化合物的嵌入向量c由化合物中的每个原子的最高层即第k层嵌入聚合而成;wk为第k层的神经网络参数矩阵,p
i,j
是化合物中的原子i和j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定长度向量的聚合函数;concat{
·
}表示向量连接操作;为所述化合物c中的第i个原子(即所述化合物的分子图g(v,e)中的第i个顶点)的第k层嵌入;
[0139]
根据所述反应模板的连通图g(v,e)计算所述反应模板库中的各逆合成反应模板的嵌入向量为t:
[0140][0141][0142]
其中,k表示卷积网络总层数,反应模板的嵌入向量t由反应模板中每个原子的最高层即第k层嵌入聚合而成;wk为第k层的神经网络参数矩阵,p
i,j
是反应模板中的原子i和j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定
长度向量的聚合函数;concat{
·
}表示向量连接操作;为所述反应模板中的第i个原子(即所述反应模板的连通图g(v,e)中的第i个顶点)的第k层嵌入;
[0143]
根据各所述逆合成反应模板的推荐分数pm=c
·
tm由高到低的顺序输出推荐的逆合成反应模板,tm为反应模板库中的第m个反应模板的嵌入,m为大于或等于1的正整数。
[0144]
s522,基于各所述逆合成反应模板获得对应的所述化合物的反应前体;
[0145]
s523,选择符合所述预设筛选条件的反应前体及对应的逆合成反应模板作为所述化合物的化学合成路线设计的一步。
[0146]
于本发明的一实施例中,所述的预设筛选条件包括合成成本;
[0147]
化合物c的合成成本为cost(c):
[0148]
如果化合物c可购买到,成本为cost(c)=1;
[0149]
如果化合物c的合成方法尚未搜索过,则估计其成本为λ-sa(c)
,其中λ为参数,可预设为0.4;sa(c)为对于未知路线的化合物c估计合成所需的反应步骤数;
[0150]
如果化合物c的合成方法已经搜索过,设其已知的单步合成方法共由n种,pi={p
ij
}表示第i种合成方法的所有前体集合,yi表示第i种合成方式的估计产率,则化合物c的合成成本为n种合成方法中代价最低的合成方式,即:
[0151][0152]
进一步,所述对于未知路线的化合物c估计合成所需的反应步骤数sa(c)的一种实现过程包括:对化合物c中的各要素预先设定合成步骤数;所述各要素的合成步骤数之和为反应步骤数sa(c);其中,所述各要素包括原子类型及个数、官能团类型及个数、长碳链长度和环个数及类型;所述原子类型及个数包括碳原子个数和杂原子个数;所述官能团类型及个数包括羰基、羧基、羟基、氰基、酰胺、或/和酰氯;所述环个数及类型包括芳香环、杂环、环大小及并环个数。
[0153]
s524,若所述反应前体为需逆合成的化合物,则对所述需逆合成的化合物重复上述处理,直至获得的反应前体为无需逆合成的化合物,至此实现所述化合物的化学合成路线设计的全部步骤。
[0154]
本发明所述的化学合成路线设计方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
[0155]
本发明还提供一种交互式化学合成路线设计系统,所述交互式化学合成路线设计系统可以实现本发明所述的交互式化学合成路线设计方法,但本发明所述的交互式化学合成路线设计方法的实现装置包括但不限于本实施例列举的交互式化学合成路线设计系统的结构,凡是根据本发明的原理所做的现有技术的结构变形和替换,都包括在本发明的保护范围内。
[0156]
参见图6所示,本发明实施例还提供一种交互式化学合成路线设计系统,所述交互式化学合成路线设计系统600包括:输入模块610,逆合成处理模块620,交互模块630,逆合成更新模块640。
[0157]
所述输入模块610获得一化合物。
[0158]
所述逆合成处理模块620与所述输入模块610通信相连,根据一预设筛选条件对所述化合物进行逐步逆合成处理,获得所述化合物的化学合成路线。
[0159]
于本发明的一实施例中,所述逆合成处理模块620将所述化合物量化为分子图g(v,e),顶点v对应于原子,边e对应于键;将所述反应模板库中的每个反应模板在其反应物与生成物中对应原子添加虚拟化学键之后被量化为连通图g(v,e);所述逆合成处理模块基于图卷积的方法于所述反应模板库中搜索最佳的逆合成反应模板,包括:
[0160]
所述逆合成处理模块根据所述化合物的分子图g(v,e)计算所述化合物的嵌入向量为:
[0161][0162][0163]
其中,k表示卷积网络总层数,化合物的嵌入向量c由化合物中的每个原子的最高层即第k层嵌入聚合而成;wk为第k层的神经网络参数矩阵,p
i,j
是化合物中的原子i和j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定长度向量的聚合函数;concat{
·
}表示向量连接操作;为所述化合物中的第i个原子(即所述化合物的分子图g(v,e)中的第i个顶点)的第k层嵌入;
[0164]
所述逆合成处理模块根据所述反应模板的连通图g(v,e)计算所述反应模板库中的各逆合成反应模板的嵌入向量为t:
[0165][0166][0167]
其中,k表示卷积网络总层数,反应模板的嵌入向量t由反应模板中每个原子的最高层即第k层嵌入聚合而成;wk为第k层的神经网络参数矩阵,p
i,j
是反应模板中的原子i和j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定长度向量的聚合函数;concat{
·
}表示向量连接操作;为所述反应模板中的第i个原子(即所述反应模板的连通图g(v,e)中的第i个顶点)的第k层嵌入;
[0168]
所述逆合成处理模块根据各所述逆合成反应模板的推荐分数pm=c
·
tm由高到低的顺序输出推荐的逆合成反应模板,tm为反应模板库中的第m个反应模板的嵌入,m为大于或等于1的正整数。
[0169]
所述交互模块630获得一偏好筛选条件;所述偏好筛选条件包括偏好特定路线或/和禁用特定路线;根据所述偏好特定路线将所述化学合成路线中的某一步指定为使用特定的逆合成反应模板完成。所述禁用特定路线为禁止所述化学合成路线中出现某一不合适的反应;根据所述禁用特定路线对所述化学合成路线中出现的某一不合适反应进行禁用,并根据所述预设筛选条件对出现所述某一不合适反应的步骤进行逆合成反应替换。
[0170]
所述逆合成更新模块640与所述交互模块630和所述逆合成处理模块620分别通信相连,根据所述偏好筛选条件对所述逆合成处理中的某一步进行更新处理,并基于所述偏好筛选条件和所述预设筛选条件对所述逆合成处理中的某一步的后续步骤进行更新处理。例如:用户可以指定路径中的某一步骤使用特定的反应完成,此时进行重新迭代计算时,系
统将会强制使用这一步骤并重新完成后续逆合成步骤的规划。或在进行路径规划时,由系统中的反应相似度评估模块将设计的步骤与所有用户指定的不合适步骤进行相似度比较。对相似步骤的反应可行性打分进行惩罚,再重新完成整个路径规划。
[0171]
本发明还提供一种化学合成路线设计系统,所述化学合成路线设计系统可以实现本发明所述的化学合成路线设计方法,但本发明所述的化学合成路线设计方法的实现装置包括但不限于本实施例列举的化学合成路线设计系统的结构,凡是根据本发明的原理所做的现有技术的结构变形和替换,都包括在本发明的保护范围内。
[0172]
参见图7所示,本发明实施例还提供一种化学合成路线设计系统,所述化学合成路线设计系统700包括:输入模块710,逆合成处理模块720。
[0173]
所述输入模块710获得一化合物。
[0174]
所述逆合成处理模块720与所述输入模块710通信相连,根据一预设筛选条件对所述化合物进行逐步逆合成处理,获得所述化合物的化学合成路线。
[0175]
于本发明的一实施例中,所述逆合成处理模块720将所述化合物量化为分子图g(v,e),顶点v对应于原子,边e对应于键;所述反应模板库中的每个反应模板在其反应物与生成物中对应原子添加虚拟化学键之后被量化为连通图g(v,e);所述逆合成处理模块基于图卷积的方法于所述反应模板库中搜索最佳的逆合成反应模板,包括:
[0176]
所述逆合成处理模块根据所述化合物的分子图g(v,e)计算所述化合物的嵌入向量为:
[0177][0178][0179]
其中,k表示卷积网络总层数,化合物的嵌入向量c由化合物中的每个原子的最高层即第k层嵌入聚合而成;wk为第k层的神经网络参数矩阵,p
i,j
是化合物中的原子i和j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定长度向量的聚合函数;concat{
·
}表示向量连接操作;为所述化合物中的第i个原子(即所述化合物的分子图g(v,e)中的第i个顶点)的第k层嵌入;
[0180]
所述逆合成处理模块根据所述反应模板的连通图g(v,e)计算所述反应模板库中的各逆合成反应模板的嵌入向量为t:
[0181][0182][0183]
其中,k表示卷积网络总层数,反应模板的嵌入向量t由反应模板中每个原子的最高层即第k层嵌入聚合而成;wk为第k层的神经网络参数矩阵,p
i,j
是反应模板中的原子i和j成键的键嵌入向量,f(
·
)是任意神经网络激活函数,reduce(
·
)是将向量集合映射到固定长度向量的聚合函数;concat{
·
}表示向量连接操作;为所述反应模板中的第i个原子(即所述反应模板的连通图g(v,e)中的第i个顶点)的第k层嵌入;
[0184]
所述逆合成处理模块根据各所述逆合成反应模板的推荐分数pm=c
·
tm由高到低的顺序输出推荐的逆合成反应模板,tm为反应模板库中的第m个反应模板的嵌入,m为大于
或等于1的正整数。
[0185]
于本发明的一实施例中,所述预设筛选条件包括合成成本;
[0186]
化合物c的合成成本为cost(c):
[0187]
如果化合物c可购买到,成本为cost(c)=1;
[0188]
如果化合物c的合成方法尚未搜索过,则估计其成本为λ-sa(c)
,其中λ为参数,可预设为0.4;sa(c)为对于未知路线的化合物c估计合成所需的反应步骤数;
[0189]
如果化合物c的合成方法已经搜索过,设其已知的单步合成方法共由n种,pi={p
ij
}表示第i种合成方法的所有前体集合,yi表示第i种合成方式的估计产率,则化合物c的合成成本为n种合成方法中代价最低的合成方式,即:
[0190][0191]
进一步,所述对于未知路线的化合物c估计合成所需的反应步骤数sa(c)的一种实现过程包括:对化合物c中的各要素预先设定合成步骤数;所述各要素的合成步骤数之和为反应步骤数sa(c);其中,所述各要素包括原子类型及个数、官能团类型及个数、长碳链长度和环个数及类型;所述原子类型及个数包括碳原子个数和杂原子个数;所述官能团类型及个数包括羰基、羧基、羟基、氰基、酰胺、或/和酰氯;所述环个数及类型包括芳香环、杂环、环大小及并环个数。
[0192]
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明所述的交互式化学合成路线设计方法的步骤或实现本发明所述的化学合成路线设计方法的步骤。
[0193]
参见图8所示,本发明实施例还提供一种电子设备,所述电子设备800包括:存储器810,处理器820。所述存储器810存储有计算机程序;所述处理器820与所述存储器通信相连,调用所述计算机程序时实现本发明所述的交互式化学合成路线设计方法的步骤或实现本发明所述的化学合成路线设计方法的步骤。
[0194]
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
[0195]
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献