一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于ChemCNet的有机合成智能分析方法及系统

2023-02-06 11:24:03 来源:中国专利 TAG:

技术特征:
1.一种基于chemcnet的有机合成智能分析方法,其特征在于,该方法包括以下步骤:1)特征描述符的计算,是根据软件将每种偶联反应的组分转化为相应的特征描述符;2)模型的建立,是构建chemcnet模型对特征描述符进行特征学习和产率的智能回归预测;3)使用特征重要性和shap值对chemcnet模型的预测结果进行可视化分析。2.根据权利要求1所述的一种基于chemcnet的有机合成智能分析方法,其特征在于,步骤1)包括:(1.1)将化学反应物和试剂导入软件,软件自动计算每种偶联反应组分的特征描述符,将化学反应物转换为一维数据;(1.2)将rfe与catboost相结合,并采用shap为特征打分从而筛选特征,再将数据联合得到二维矩阵的形式并对数据进行标准化。3.根据权利要求2所述的一种基于chemcnet的有机合成智能分析方法,其特征在于,步骤(1.2)包括:选取rfe后向搜索方法,shap值作为特征评价标准,为特征打分;根据后向搜索的原理,删除特征得分最低的特征,然后在剩余特征上继续构建模型,重新得到新一轮的特征排序,再删除得分最低的特征,重复此过程,依次删除特征得分最低的特征,直至达到指定的特征数量;其中,在每一次的迭代过程中,会重新评价当前的剩余特征构成的集合,每一个特征的得分在反复迭代过程中得到调整,最终以模型的预测指标rmse的形式呈现;得到筛选后的特征之后,将这些特征划分为训练集和测试集;并将其分别与对应的产率匹配;再对数据进行标准化处理;之后将筛选后得到的数据集(1
×
24)扩展为(1
×
25)。4.根据权利要求1所述的一种基于chemcnet的有机合成智能分析方法,其特征在于,步骤2)包括:(2.1)构建chemcnet模型;构建注意力卷积神经网络,将训练集导入卷积神经网络进行特征学习,挖掘数据深层特征,在卷积神经网络模型中融入注意力,通过不断迭代学习,分别计算每轮迭代的损失函数值,直至得到的损失函数值最小时,保存训练好的模型;(2.2)产率的智能回归预测;将训练集和对应的产率导入卷积神经网络进行特征学习,将最后一层全连接层的输出作为catboost模型的输入数据进行训练预测,即为最终预测结果;采用可决系数和均方根误差评估模型的预测效果;(2.3)对训练好的模型进行样本外预测,若样本外预测是有效的,则验证了训练好的模型的有效性和有泛化性;(2.4)用户可根据预测效果,结合自身需求,自我进行参数调整,若不满意,则用户可以调整卷积神经网络的卷积核大小,层数、节点数,以及catboost相关参数,并返回步骤(2.2),直至用户满意。5.根据权利要求1所述的一种基于chemcnet的有机合成智能分析方法,其特征在于,步骤3)包括:(3.1)通过catboost输出特征描述符的重要性排序,以此找到对反应产率影响显著的描述符;使用shap值分析描述符与反应产率间的相关关系,以及单一特征反应产率间的内部关系,为用户提供有关有机化学偶联反应的决策信息。
6.根据权利要求4所述的一种基于chemcnet的有机合成智能分析方法,其特征在于,步骤(2.1)包括:(2.1.1)通过输入层,隐含层和输出层搭建了一种卷积神经网络模型;其中隐含层包括5层卷积层,每层激活函数为relu函数和3层全连接层;(2.1.2)在最后一层卷积层后加入一层注意力层;(2.1.3)对构建好的模型进行训练,设置全部训练集的训练所需的迭代次数为p,一次读入的数据量为q,其中p≥1,q≥1;(2.1.4)多次迭代学习并计算每次迭代网络模型的损失函数值,当损失函数值收敛到最小时,保存模型参数;(2.1.5)将最后一层全连接层的提取的特征作为新的输出数据导入catboost模型进行训练预测;即为最终预测结果;采用可决系数和均方根误差评估模型的预测效果;其中,所述注意力层采用eca-net;设一个卷积块的输出为x∈r
w
×
h
×
c
,其中w、h和c分别为宽度、高度和通道维度,r为实数域;不降维的聚合特征y∈r
c
;其中,r为实数域;c为通道维度;eca模块使用了一个频带矩阵w
k
来学习通道注意:此处涉及了k
×
c个参数,y
i
的权重的计算只考虑y
i
和它的k个邻居之间的相互作用,即y
i
的权重为:其中,ω
i
为y
i
的权重;σ为sigmoid函数;为y
i
和它的k个邻居之间的相互作用,(如w
1,1
,...,w
1,k
);为y
i
的第j个相邻通道;为y
i
的k个相邻通道的集合;使所有通道共享相同的学习参数,即:其中,ω
i
为y
i
的权重;σ为sigmoid函数;为y
i
和它的k个邻居之间的相互作用;为y
i
的第j个相邻通道;为y
i
的k个相邻通道的集合;使所有通道共享相同的学习参数可以通过一个核大小为k的一维卷积来实现,即:ω=σ(c1d
k
(y))其中,c1d为一维卷积;σ为sigmoid函数;确定一维卷积的核大小k;在k和c之间存在一个映射φ:c=φ(k);映射是一个线性函数,即φ(k)=γ*k-b;γ为线性函数中一次项的系数,b为常数项;然后将线性函数φ(k)=γ*k-b扩展到非线性函数,即:c=φ(k)=2
(γ*k-b)
然后,给定通道维数c,核大小k可以自适应地确定:
其中,表示的最接近奇数;最后用全连接层来把提取到的特征综合起来;再将全连接层提取的特征作为输入数据导入catboost模型进行回归预测;catboost模型使用以下方式:对于每个样本x
k
,训练一个单独的模型m
k
,该模型由不包含样本x
k
的训练集训练得到,而且使用该模型来估计x
k
上的梯度,并使用此估计对得到的树进行评分;即使用在前面的样本上训练的当前模型来更新模型的新样本的梯度,提供了无偏梯度;在学习过程的每一步t中,每个模型都被解释为一个模型f
t
的近似值;catboost首先为训练样本生成s 1个随机序列σ0,σ1,...,σ
s
,其中σ1,...,σ
s
用来构建决策树,σ0用来选择叶子节点的值,然后采用梯度步长的无偏估计,之后再进行标准的gbdt;除此之外,catboost使用对称树结构作为基本预测器,且在整个树中使用相同的分裂标准。7.一种基于chemcnet的有机合成智能分析系统,其特征在于,该系统包括,特征描述符输入与预处理模块,用于根据软件将每种偶联反应的组分转化为相应的特征描述符;基于chemcnet系统的智能分析模块,用于构建chemcnet模型对特征描述符进行特征学习和产率的智能预测;基于可视化的结果可解释分析模块,用于使用特征重要性和shap值等对chemcnet模型的预测结果进行可视化分析。

技术总结
本发明涉及人工智能的有机合成技术领域,具体涉及一种基于ChemCNet的有机合成智能分析方法及系统;该方法包括:1)特征描述符的计算,根据软件将化学反应条件转化为特征描述符;2)模型的建立,构建注意力驱动,并结合深度学习和集成提升树CatBoost的ChemCNet模型,对特征描述符进行再表示学习、产率进行智能预测,对产率和反应条件内在关系进行分析;3)使用特征重要性和SHAP值对ChemCNet模型及其预测结果进行可视化分析。该方法能够降低数据冗余性,实现化学反应产率的精准预测;符合绿色化学,智慧化学理念,在节约资源的基础上实现对产率的精准预测,并智能分析反应条件与产率之间的内在关系。之间的内在关系。之间的内在关系。


技术研发人员:彭李超 王恒哲 杨晓慧 郭艳慧 李子欣 余亚萍
受保护的技术使用者:河南大学
技术研发日:2022.11.07
技术公布日:2023/2/3
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献