一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

表面活性剂的构效关系研究方法和装置与流程

2021-10-19 20:56:00 来源:中国专利 TAG:关系 研究 表面活性剂 装置 分子

技术特征:
1.一种表面活性剂的构效关系研究方法,其特征在于,所述方法包括:获取多个样本表面活性剂的临界胶束浓度cmc,以及获取所述多个样本表面活性剂的多个第一特征变量,每个样本表面活性剂均具有多个第一特征变量,所述样本表面活性剂为咪唑鎓盐类双子表面活性剂;对于每个样本表面活性剂,将所述每个样本表面活性剂的多个第一特征变量进行共线性聚类,得到多个第二特征变量;对所述多个第二特征变量进行非线性主成分分析压缩,得到多个第一主成分变量,从所述多个第一主成分变量中提取第一数量个第一主成分变量;根据每个样本表面活性剂的cmc、所述每个样本表面活性剂对应的第一数量个第一主成分变量和多元线性回归方程进行模型训练,得到预测模型;当对待预测的目标表面活性剂的cmc进行预测时,获取所述目标表面活性剂的第一数量个第二主成分变量,所述目标表面活性剂为咪唑鎓盐类双子表面活性剂;将所述第一数量个第二主成分变量输入所述预测模型中,得到所述目标表面活性剂的cmc。2.根据权利要求1所述的方法,其特征在于,所述将所述每个样本表面活性剂的多个第一特征变量进行共线性聚类,得到多个第二特征变量,包括:确定每两个第一特征变量之间的线性相关系数;将所述线性相关系数不小于预设阈值的第一特征变量聚为一类,得到多个分类,每个分类中包括至少两个第一特征变量,且每个分类中任意两个第一特征变量之间的线性相关系数不小于所述预设阈值;对每个分类中的每个第一特征变量进行特征评分;从所述每个分类中选择特征评分最高的第一特征变量,将特征评分最高的第一特征变量作为第二特征变量,得到多个第二特征变量。3.根据权利要求2所述的方法,其特征在于,所述确定每两个第一特征变量之间的线性相关系数,包括:获取所述每个样本表面活性剂的每个第一特征变量的特征值以及所述多个样本表面活性剂和测试表面活性剂的总数量;根据所述每个第一特征变量的特征值和所述总数量,通过以下公式一,确定每两个第一特征变量之间的线性相关系数;公式一:其中,r
ij
表示第i个第一特征变量和第j个第一特征变量之间的线性相关系数,i表示第i个第一特征变量,j表示第j个第一特征变量,k表示第k个样本表面活性剂,n表示所述总数量,表示所述多个样本表面活性剂的第i个第一特征变量的平均值,表示所述多个样本表面活性剂的第j个第一特征变量的平均值,x
ik
表示第k个样本表面活性剂的第i个第一特征变量的特征值,x
jk
表示第k个样本表面活性剂的第j个第一特征变量的特征值。
4.根据权利要求1所述的方法,其特征在于,所述根据每个样本表面活性剂的cmc、所述每个样本表面活性剂对应的第一数量个第一主成分变量和多元线性回归方程进行模型训练,得到预测模型,包括:对于所述每个样本表面活性剂,通过以下公式二,将所述样本表面活性剂的cmc、所述样本表面活性剂对应的第一数量个第一主成分变量代入所述多元线性回归方程中,得到所述预测模型;公式二:lg(cmc)=a0 a1x1 a2x2 ... a
m
x
m
其中,lg(cmc)表示所述样本表面活性剂的cmc,a0、a1、a2和a
m
均表示常数,x1、x2、x
m
分别表示第一主成分变量,m表示第一数量。5.根据权利要求1所述的方法,其特征在于,所述将所述每个样本表面活性剂的多个第一特征变量进行共线性聚类,得到多个第二特征变量之前,所述方法还包括:根据获取的所述每个样本表面活性剂的每个第一特征变量的特征值,确定所述多个样本表面活性剂中每个第一特征变量的最大值及最小值;根据所述每个样本表面活性剂的每个第一特征变量的特征值、所述多个样本表面活性剂中每个第一特征变量的最大值及最小值,通过以下公式三,对所述每个样本表面活性剂的每个第一特征变量进行归一化处理;公式三:其中,x

ik
表示第k个样本表面活性剂的第i个第一特征变量归一化处理之后的特征值,x
ik
表示第k个样本表面活性剂的第i个第一特征变量的特征值,表示所述多个样本表面活性剂中第i个第一特征变量的最大值,表示所述多个样本表面活性剂中第i个第一特征变量的最小值,i表示第i个第一特征变量,k表示第k个样本表面活性剂。6.根据权利要求1所述的方法,其特征在于,所述将所述第一数量个第二主成分变量输入所述预测模型中,得到所述目标表面活性剂的cmc之前,所述方法还包括:获取测试表面活性剂的第一数量个第三主成分变量和所述测试表面活性剂经实验得到的实验cmc;将所述第一数量个第三主成分变量输入所述预测模型中,得到所述测试表面活性剂的预测cmc;根据所述实验cmc和所述预测cmc,对所述预测模型进行测试;当所述预测模型测试成功时,执行所述将所述第一数量个第二主成分变量输入所述预测模型中,得到所述目标表面活性剂的cmc的步骤。7.根据权利要求6所述的方法,其特征在于,所述根据所述实验cmc和所述预测cmc,对所述预测模型进行测试,包括:根据所述实验cmc和所述预测cmc,确定所述实验cmc和所述预测cmc之间的平均绝对误差、平均绝对相对误差和皮尔逊相关系数;当所述平均绝对误差大于第一预设阈值,所述平均绝对相对误差大于第二预设阈值,且所述皮尔逊相关系数大于第三预设阈值时,确定所述预测模型测试成功。8.一种表面活性剂的构效关系研究装置,其特征在于,所述装置包括:第一获取模块,用于获取多个样本表面活性剂的临界胶束浓度cmc,以及获取所述多个
样本表面活性剂的多个第一特征变量,每个样本表面活性剂均具有多个第一特征变量,所述样本表面活性剂为咪唑鎓盐类双子表面活性剂;聚类模块,用于对于每个样本表面活性剂,将所述每个样本表面活性剂的多个第一特征变量进行共线性聚类,得到多个第二特征变量;提取模块,用于对所述多个第二特征变量进行非线性主成分分析压缩,得到多个第一主成分变量,从所述多个第一主成分变量中提取第一数量个第一主成分变量;训练模块,用于根据每个样本表面活性剂的cmc、所述每个样本表面活性剂对应的第一数量个第一主成分变量和多元线性回归方程进行模型训练,得到预测模型;第二获取模块,用于当对待预测的目标表面活性剂的cmc进行预测时,获取所述目标表面活性剂的第一数量个第二主成分变量,所述目标表面活性剂为咪唑鎓盐类双子表面活性剂;第一输入模块,用于将所述第一数量个第二主成分变量输入所述预测模型中,得到所述目标表面活性剂的cmc。9.根据权利要求8所述的装置,其特征在于,所述聚类模块,还用于确定每两个第一特征变量之间的线性相关系数;将所述线性相关系数不小于预设阈值的第一特征变量聚为一类,得到多个分类,每个分类中包括至少两个第一特征变量,且每个分类中任意两个第一特征变量之间的线性相关系数不小于所述预设阈值;对每个分类中的每个第一特征变量进行特征评分;从所述每个分类中选择特征评分最高的第一特征变量,将特征评分最高的第一特征变量作为第二特征变量,得到多个第二特征变量。10.根据权利要求9所述的装置,其特征在于,所述聚类模块,还用于获取所述每个样本表面活性剂的每个第一特征变量的特征值以及所述多个样本表面活性剂和测试表面活性剂的总数量;根据所述每个第一特征变量的特征值和所述总数量,通过以下公式一,确定每两个第一特征变量之间的线性相关系数;公式一:其中,r
ij
表示第i个第一特征变量和第j个第一特征变量之间的线性相关系数,i表示第i个第一特征变量,j表示第j个第一特征变量,k表示第k个样本表面活性剂,n表示所述总数量,表示所述多个样本表面活性剂的第i个第一特征变量的平均值,表示所述多个样本表面活性剂的第j个第一特征变量的平均值,x
ik
表示第k个样本表面活性剂的第i个第一特征变量的特征值,x
jk
表示第k个样本表面活性剂的第j个第一特征变量的特征值。11.根据权利要求8所述的装置,其特征在于,所述训练模块,还用于对于所述每个样本表面活性剂,通过以下公式二,将所述样本表面活性剂的cmc、所述样本表面活性剂对应的第一数量个第一主成分变量代入所述多元线性回归方程中,得到所述预测模型;公式二:lg(cmc)=a0 a1x1 a2x2 ... a
m
x
m
其中,lg(cmc)表示所述样本表面活性剂的cmc,a0、a1、a2和a
m
均表示常数,x1、x2、x
m
分别表示第一主成分变量,m表示第一数量。12.根据权利要求8所述的装置,其特征在于,所述装置还包括:
确定模块,用于根据获取的所述每个样本表面活性剂的每个第一特征变量的特征值,确定所述多个样本表面活性剂中每个第一特征变量的最大值及最小值;归一模块,用于根据所述每个样本表面活性剂的每个第一特征变量的特征值、所述多个样本表面活性剂中每个第一特征变量的最大值及最小值,通过以下公式三,对所述每个样本表面活性剂的每个第一特征变量进行归一化处理;公式三:其中,x

ik
表示第k个样本表面活性剂的第i个第一特征变量归一化处理之后的特征值,x
ik
表示第k个样本表面活性剂的第i个第一特征变量的特征值,表示所述样本表面活性剂中第i个第一特征变量的最大值,表示所述样本表面活性剂中第i个第一特征变量的最小值,i表示第i个第一特征变量,k表示第k个样本表面活性剂。13.根据权利要求8所述的装置,其特征在于,所述装置还包括:第三获取模块,用于获取测试表面活性剂的第一数量个第三主成分变量和所述测试表面活性剂经实验得到的实验cmc;第二输入模块,用于将所述第一数量个第三主成分变量输入所述预测模型中,得到所述测试表面活性剂的预测cmc;测试模块,用于根据所述实验cmc和所述预测cmc,对所述预测模型进行测试;所述第一输入模块,还用于当所述预测模型测试成功时,将所述第一数量个第二主成分变量输入所述预测模型中,得到所述目标表面活性剂的cmc。14.根据权利要求13所述的装置,其特征在于,所述测试模块,还用于根据所述实验cmc和所述预测cmc,确定所述实验cmc和所述预测cmc之间的平均绝对误差、平均绝对相对误差和皮尔逊相关系数;当所述平均绝对误差大于第一预设阈值,所述平均绝对相对误差大于第二预设阈值,且所述皮尔逊相关系数大于第三预设阈值时,确定所述预测模型测试成功。

技术总结
本申请公开了一种表面活性剂的构效关系研究方法和装置,属于分子构效关系研究技术领域。本申请实施例提供的表面活性剂的构效关系研究方法,通过将多个第一特征变量进行共线性聚类,避免了特征变量之间的共线性导致特征变量冗余的问题,且对第二特征变量进行非线性主成分分析压缩,避免了特征变量数量过多导致的过拟合的问题,从而提高了预测模型预测的准确性。性。性。


技术研发人员:刘友权 唐永帆 熊颖 吴文刚 张燕 原励 杜国滨 石晓松
受保护的技术使用者:中国石油天然气股份有限公司
技术研发日:2020.04.10
技术公布日:2021/10/18
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜