一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

逆合成相关合成可行性的制作方法

2022-11-14 03:02:26 来源:中国专利 TAG:

技术特征:
1.一种用于训练模型计算以合成可行性的方法,其特征在于,包括:访问分子数据库并获得目标分子;将所述目标分子切片成分子片段;确定所述目标分子的多个分子片段的片段频率;计算所述分子片段的分子描述符;计算所述目标分子的合成难度得分;以及将所述目标分子的合成难度得分存储在数据库中,所述数据库具有多个分子的多个合成难度得分。2.根据权利要求1所述的方法,其特征在于,包括接收训练分子的训练数据集以获得所述目标分子的化学结构和性质的数据。3.根据权利要求1所述的方法,其特征在于,所述切片包括分解所述目标分子以获得可合成片段,其中分解函数:产生有效的类药物分子结构;以及所述分解函数是可逆的,因此获得的可合成片段可以转化回目标分子。4.根据权利要求3所述的方法,其特征在于,通过逆合成相关分解函数执行所述分解。5.根据权利要求1所述的方法,其特征在于,包括评估所述可合成片段的化学性质。6.根据权利要求5所述的方法,其特征在于,通过所述分子描述符的计算和聚合执行所述评估。7.根据权利要求6所述的方法,其特征在于,所述分子描述符的聚合包括:手性碳数,即手性碳原子数;环数,即总环数;环侧链数,即连接到环系统的侧链数;螺数,即螺碳原子数;最大环尺寸,如果大于6,则为分子结构的最大环中的原子数,否则为0;稠环数,是分子结构中的稠环数;以及桥原子数,是分子结构的双环模式中的桥头原子数。8.根据权利要求2所述的方法,其特征在于,通过对包含所述分子片段的分子数除以所述训练数据集中的分子数应用等式或对数的函数来确定所述片段频率。9.根据权利要求2所述的方法,其特征在于,包括基于所述训练分子中的所述可合成片段的频率,在所述训练分子的所述训练数据集上计算所述目标分子的片段密度函数。10.根据权利要求2所述的方法,其特征在于,包括根据所述片段频率,将所述目标分子的可合成片段的片段信息聚合为片段得分。11.根据权利要求10所述的方法,其特征在于,通过应用于片段和片段频率的分子描述符的数学函数执行所述聚合。12.根据权利要求10所述的方法,其特征在于,包括获得所述片段得分并将所述片段得分保存在片段得分的数据库中。13.根据权利要求10所述的方法,其特征在于,包括将合成可行性得分计算为片段密度函数与片段得分和片段频率的线性组合之间的乘积。14.根据权利要求13所述的方法,其特征在于,包括以下至少一项:
提供计算的合成可行性得分;或通过数学函数将所述计算的合成可行性得分标准化为评分。15.一种评估分子合成可行性的方法,其特征在于,所述方法包括:选择目标分子;将所述目标分子分解为分子片段;计算所述目标分子的分子片段的合成难度得分;确定所述分子片段的合成难度得分的总和;确定所述分子片段的片段密度;根据所述合成难度得分的总和以及片段密度计算合成可行性得分;以及提供所述目标分子的所述合成可行性得分。16.根据权利要求15所述的方法,其特征在于,包括获得所述目标分子的化学结构和性质的数据。17.根据权利要求15所述的方法,其特征在于,包括从用于计算合成可行性的训练模型获得可合成片段的得分。18.根据权利要求17所述的方法,其特征在于,包括计算不能从所述训练模型获得其性质的片段的分子性质。19.根据权利要求18所述的方法,其特征在于,包括计算不能从所述训练模型获得其片段密度函数的片段的片段密度函数。20.根据权利要求15所述的方法,其特征在于,包括将处理的信息聚集到所述目标分子的合成可行性得分。21.根据权利要求15所述的方法,其特征在于,通过逆合成相关分解函数执行所述分解,所述逆合成相关分解函数可选地选自开源brics或recap算法。22.根据权利要求15所述的方法,其特征在于,包括评估所述可合成片段的化学性质。23.根据权利要求22所述的方法,其特征在于,通过所述分子描述符的计算和聚合执行所述评估。24.根据权利要求23所述的方法,其特征在于,所述分子描述符的聚合包括:手性碳数,即手性碳原子数;环数,即总环数;环侧链数,即连接到环系统的侧链数;螺数,即螺碳原子数;最大环尺寸,如果大于6,则为分子结构的最大环中的原子数,否则为0;稠环数,是分子结构中的稠环数;以及桥原子数,是分子结构的双环模式中的桥头原子数。25.根据权利要求15所述的方法,其特征在于,包括基于所述训练分子中的所述可合成片段的频率,在所述训练分子的所述训练数据集上计算所述目标分子的片段密度函数。26.根据权利要求15所述的方法,其特征在于,包括根据所述片段频率,将所述目标分子的可合成片段的处理的信息聚合为片段得分。27.根据权利要求26所述的方法,其特征在于,通过应用于片段和片段频率的分子描述符的数学函数执行所述聚合。
28.根据权利要求15所述的方法,其特征在于,所述合成可行性得分被评分为从1到n,其中n>1。29.根据权利要求15所述的方法,其特征在于,不存在用于所述目标分子或可合成片段的供应商数据库。30.根据权利要求15所述的方法,其特征在于,包括:通过迭代协议计算所述目标分子的合成难度得分,包括:识别所述目标分子的所有分子片段;检查合成难度得分数据库中的所有分子片段;当分子片段是合成难度得分数据库时,将所述分子片段的合成难度得分添加到合成难度得分阵列中;当分子片段不在合成难度得分中时,则:计算分子片段的分子描述符;计算具有最小频率的片段的合成难度得分;以及将计算的所述分子片段的合成难度得分添加到合成难度得分阵列中。31.一种或多种存储指令的非暂时性计算机可读介质,所述指令响应于由一个或多个处理器执行而使计算机系统执行操作,其特征在于,所述操作包括如权利要求1所述的计算机方法。32.一种或多种存储指令的非暂时性计算机可读介质,所述指令响应于由一个或多个处理器执行而使计算机系统执行操作,其特征在于,所述操作包括如权利要求15所述的计算机方法。33.一种计算机系统,其特征在于,包括:一个或多个处理器;以及一种或多种存储指令的非暂时性计算机可读介质,所述指令响应于由所述一个或多个处理器执行而使计算机系统执行操作,所述操作包括如权利要求1所述的计算机方法。34.一种计算机系统,其特征在于,包括:一个或多个处理器;以及一种或多种存储指令的非暂时性计算机可读介质,所述指令响应于由所述一个或多个处理器执行而使计算机系统执行操作,所述操作包括如权利要求15所述的计算机方法。

技术总结
一种用于训练模型以计算合成可行性的方法,包括:访问分子数据库并获得分子;虚拟地将所述分子切片成片段;确定片段的片段频率;计算片段的分子描述符;计算分子的合成难度得分;以及将所述合成难度得分存储在数据库中。一种评估分子合成可行性的方法,所述方法包括:选择目标分子;将所述目标分子分解为分子片段;计算所述目标分子的分子片段的合成难度得分;确定所述分子片段的合成难度得分的总和;确定所述分子片段的片段密度;根据所述合成难度得分的总和以及片段密度计算合成可行性得分;以及提供所述目标分子的合成可行性得分。分。分。


技术研发人员:B
受保护的技术使用者:英矽智能科技有限公司
技术研发日:2021.05.11
技术公布日:2022/11/11
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献