一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于可变半径高斯球的分子体积计算方法以及用于药物虚拟筛选的分子三维相似度打分方法与流程

2021-11-03 12:58:00 来源:中国专利 TAG:

技术特征:
1.基于可变半径高斯球的分子体积计算方法,其特征在于:该方法包括以下步骤:读入分子的三维结构信息,所述三维结构信息包括分子中每个原子的类型及其坐标数值;根据分子中各原子的类型得到原子的范德华半径,将三维结构信息转换为一组代表分子中各原子的高斯球,每个高斯球的半径不等于原子的范德华半径,而是小于其范德华半径,高斯球半径的计算公式如下:其中:对于原子i,其范德华半径为ri,体积为vi,该原子与其它原子总的重叠体积为oi;α为可调参数,取值在0~1.0之间,通过虚拟筛选的测试数据调整到最佳分类效果;通过以上公式计算得到调整后的高斯球半径r
i
,高斯球的位置坐标与原子的坐标相同;计算分子中高斯球组的叠合体积,其中第ij个高斯球组包括第i个原子对应的高斯球和第j个原子对应的高斯球,第ij个高斯球组的叠合体积为v
ij
;计算分子的体积即为其自身的叠合体积n是分子中原子的总数。2.一种用于药物虚拟筛选的分子三维相似度打分方法,其特征在于:包括以下步骤:步骤一、基于可变半径高斯球的分子体积计算该步骤是采用权利要求1的计算方法;步骤二、基于可变半径高斯球,计算用于相似性比较的两分子的各类特征参数分别读取用于相似性比较的两分子的拓扑结构和三维结构信息,获取各类特征参数,所述特征参数包括:两分子的原子个数差异(f1);两分子的可旋转化学键个数(f2);两分子的体积差异(f3);两分子的形状相似度(f4);两分子氢键受体的相似度(f5);两分子氢键供体的相似度(f6);两分子芳香环的相似度(f7);两分子的疏水中心相似度(f8);两分子的正电基团相似度(f9);以及两分子的负电基团相似度(f10);其中:f1的计算方式是通过读入两分子各自的拓扑结构信息,然后取两分子原子总数差值的绝对值;f2的计算方式是在f1计算方式的基础上,判断每个化学键是否为可旋转键,得到两分子各自的可旋转键总数,然后取两分子可旋转键总数差值的绝对值;f3的计算方式是在f1计算方式的基础上,根据两分子中各原子的类型得到原子的范德华半径,采用步骤一的方法,计算两分子各自自身的叠合体积为华半径,采用步骤一的方法,计算两分子各自自身的叠合体积为n是分子中原子的总数;然后取两分子自身叠合体积的差值的绝对值;f4的计算方式是在f3计算方式的基础上,计算两分子在多种叠合情况下的分子间叠合体积其中v
ij
为第一分子中的第i个原子与第二个分子中的第j个原子的叠合体积,n是第一个分子中原子的总数,m是第二个分子中原子的总数,选择其中的最大值
作为最大分子间体积;计算两分子的形状相似度其中v
a
是第一个分子的自身叠合体积,v
b
是第二个分子的自身叠合体积;f5的计算方式是在f1计算方式的基础上,找出两分子中氢键受体位置;计算两分子中各自氢键受体的叠合体积其中f
ij
为第i个氢键受体与第j个氢键受体之间的叠合体积;计算两分子在多种叠合情况下的分子间氢键受体的叠合体积其中f
ij
为第一分子中的第i个氢键受体与第二个分子中的第j个氢键受体的叠合体积,n是第一个分子中氢键受体的总数,m是第二个分子中氢键受体的总数,选择其中的最大值作为最大分子间氢键受体的叠合体积;计算两分子的氢键受体相似度其中p
a
是第一个分子中氢键受体的自身叠合体积,p
b
是第二个分子中氢键受体的自身叠合体积;f6的计算方式与f5的计算方式相同,只需要将两分子中的氢键受体替换为氢键供体;f7的计算方式与f5的计算方式相同,只需要将氢键受体替换为芳香环;f8的计算方式与f5的计算方式相同,只需要将氢键受体替换为疏水中心;f9的计算方式与f5的计算方式相同,只需要将氢键受体替换为正电基团;f10的计算方式与f5的计算方式相同,只需要将氢键受体替换为负电基团;步骤三、训练深度学习模型采用dud

e数据集,数据集中有102个生物靶点信息,每个靶点都有对应的活性分子集与decoy分子集,对每个靶点的数据做如下处理:选取每个靶点的活性分子集中的晶体结构分子作为模板分子,分别与该靶点的活性分子集的其他分子,以及decoy分子集的所有分子,均按照步骤二中的计算方式,计算模板分子与其他分子中两两分子的f1~f10特征参数,使每个靶点都计算得到一套特征参数数据;使用深度学习方法进行建模,将上述计算得到的每个靶点的特征参数数据作为输入数据,而分子的活性与否作为二分类的目标函数,模型优化的方向是使得所有靶点在分子活性预测的误差最小化,从而使auc值的平均值最大;完成训练后,即得到最终的深度学习模型;步骤四、深度学习模型的外部验证采用muv数据集验证深度学习模型的泛化能力,选取muv数据集中的10个生物靶点信息,每个靶点都有对应的活性分子集与decoy分子集;选取每个靶点的活性分子集中的晶体结构分子作为模板分子,分别与该靶点的活性分子集的其他分子,以及decoy分子集的所有分子,均按照步骤二中的计算方式,计算模板分子与其他分子中两两分子的f1~f10特征参数;将这些特征参数输入已经训练完成的深度学习模型,计算得到每个靶点虚拟筛选的auc值。3.根据权利要求2所述的一种用于药物虚拟筛选的分子三维相似度打分方法,其特征在于:步骤二中,所述三维结构信息包括分子中原子总数、化学键总数、每个原子的类型及其坐标数值。
4.根据权利要求2所述的一种用于药物虚拟筛选的分子三维相似度打分方法,其特征在于:步骤三中,采用类5倍交叉验证的方式,对每个靶点计算虚拟筛选的auc值。

技术总结
本发明涉及计算机辅助药物研发技术领域,具体涉及一种基于可变半径高斯球的分子体积计算方法以及用于药物虚拟筛选的分子三维相似度打分方法。本发明改进了高斯球半径的取值方法,即高斯球半径不等于相应原子的范德华半径,而是小于其范德华半径,且改变的比例与该原子所在的化学环境相关,从而消除了由于高斯球相互重叠带来的误差,有效提升了药物虚拟筛选的精度;进一步通过选取多维度相似性作为特征参数,经深度神经网络的变换,给出最终的综合打分。该打分方法使药物筛选准确率上有显著改进,同时保持着筛选高通量的计算速度,这样能够尽可能多地将具有潜在生物活性的分子从含有大量分子的数据库中筛选出来,以解决假阳性或假阴性的问题。性或假阴性的问题。


技术研发人员:严鑫 李瑞麟 卢峰
受保护的技术使用者:北京中大唯信科技有限公司
技术研发日:2021.08.10
技术公布日:2021/11/2
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献