一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法

2023-01-06 02:29:28 来源：中国专利 TAG：

1.本发明属于材料结构技术领域，具体涉及一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法。

背景技术：

2.晶格常数a、b、c是钙钛矿晶胞的边长，是钙钛矿晶体结构的关键基本参数，它强烈影响立方钙钛矿氧化物的电子结构，从而影响立方钙钛矿材料的行为。此外，它对立方钙钛矿材料的带隙、物理性质和稳定性有重要影响，可用于各种能带结构计算。晶格常数的预测对预测材料性能和筛选材料有着重要意义。
3.现有技术中，晶格常数由x射线衍射的实验获得，或者通过第一性原理计算算出来。但这两种方法都需要人工干预也非常耗时，而且需要高昂的成本，不适用于大规模的材料研究工作，不利于自动化筛选出目标性能的材料。随着高通量计算和实验的不断发展，出现了大量的材料数据库，这些数据库的出现，为数据驱动和机器学习的方法研究材料奠定了坚实基础。与传统的科学计算相比，机器学习计算成本低、开发周期短、数据分析和预测能力强，可以实质性的加速材料的筛选工作。

技术实现要素：

4.本发明在现有技术的基础上，克服了效率低的不足，提升了获得钙钛矿晶格常数的精确性，提出了一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法，在不需要任何人工干预的情况下，可以大规模自动化快速地获得相当精确的钙钛矿晶格常数并且可以识别出晶体所属空间群。
5.本发明通过以下技术方案来实现上述目的：一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法，包括如下步骤：s1、通过不同来源采集各种晶体结构的abx3型钙钛矿的晶格常数及元素特征数据，经过筛选后获得原始数据集；s2、在所述原始数据集的基础上，根据键价理论、动力学和热力学原理计算每种abx3型钙钛矿的键价向量和bvvs、n个原子体系总动能ekin和晶体的热膨胀系数α，将上述参数共同作为特征描述符数据；s3、基于所述原始数据集和所述特征描述符构建训练集和测试集；s4、基于改进的adarnn神经网络算法模型构建晶体空间群识别模型，根据s2的训练集和测试集对所构建的空间群识别模型进行训练，得到训练好的空间群识别模型；s5、针对待预测的钙钛矿材料，利用训练好的晶格常数预测模型预测该钙钛矿材料的晶格常数和采用训练好的空间群识别模型识别该钙钛矿晶体材料。
6.作为本发明的进一步优化方案，所述s1中不同来源具体为实验数据、数据库数据、已发表的论文数据，数据库为materials project、icsd数据库。
7.所述s1中元素特征数据还包括原子个数、原子序数、周期表中的组、周期表中的周
期、原子质量、摩尔体积、原子半径、离子半径、范德华半径、共价半径、鲍林电负性、电子亲和性、导热系数、沸点、熔点、临界温度、熔化焓、第一电离能、s轨道中的电子数、p轨道中的电子数、d轨道中的电子数、f轨道中的电子数、电阻率。
8.作为本发明的进一步优化方案，所述s1中的筛选，具体步骤如下：根据公式(1) 计算出每种钙钛矿goldschmid容忍因子值t，筛选0.8《t≤1.0 范围内的所有数据作为第一数据集；
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（1）式中，ra、rb和r
x
分别是abx3型钙钛矿材料中a位、b位和x位的有效离子半径。在理想的立方相钙钛矿结构中，t值等于1。一般情况下，在 0.8《t《1.0 的范围内，钙钛矿均可以形成。
9.作为本发明的进一步优化方案，所述s2中钙钛矿键价向量和bvvs的具体计算公式如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（2）
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（3）
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（4）式中，b是一个常量为0.37
ꢀå
，r0与原子或离子类型有关的经验常数，为原子i和原子j之间的键价，为原子i和原子j之间的键长，是原子i指向原子j的单位向量，为原子价态，即键价向量和bvvs；所述s2中n个原子体系总动能e
kin
的计算过程为：根据分子动力学模拟分别计算出abx3型钙钛矿中n个原子体系总动能e
kin
，具体为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（5）式中，n为原子个数，mi为第i个原子的质量，vi为第i个原子的速度；所述s2中晶体的热膨胀系数α的计算过程为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（6）式中，κ为波尔滋蔓常数，z、m分别为阳离子化合价和配位数，u（ab）为晶格能，δ为原子序数相关常数，β为与结构类型相关参数。
10.分别从原子尺度的化学键与原子价态、动力学和热力学角度来表征晶格常数的变化。可以反映abx3型化合物bx6八面体畸变的结构特征的变量，并应用对未知型化合物形成钙钦矿结构的晶格常数进行预测。
11.作为本发明的进一步优化方案，所述s3具体为：
s301、将分子描述符加入原始数据集获得样本数据集，再对实验数据、数据库数据、已发表的论文数据不同来源的数据设置比例因子γ，初始化为5：3：2；s302、按照比例因子γ对数据进行拼接汇总，把拼接好的数据打乱顺序，随机划分出90%的训练集和10%的测试集。
12.作为本发明的进一步优化方案，所述s4中改进的adarnn神经网络算法模型具体为：s401、构建原始rnn层，输入x1，x2 ，
…
，xt，对应隐藏状态h1，h2
ꢀ…
，ht，输出y1，y2
ꢀ…
， yt，运算过程可以表示为：
ꢀꢀꢀꢀꢀꢀꢀ
（7）
ꢀꢀꢀꢀ
（8）其中，u、w、v、b、c均为参数，而f表示激活函数，具体为tanh函数；s402、构建第一个模块，即由五块带有自注意力机制的一维的resnet残差块连接组成，残差块中的卷积层全部替换成全连接层（学习层）；s403、构建第二个模块，即采用gru和lstm串接连接组成的单元（强化记忆层）；s404、构建第三个模块，即2层cnn模块，卷积核为1x1；s405、把上述模块一、模块二并联起来，并且纵向用模块三串联起这两个模块，最后整体串联到rnn上，如果是识别空间群最后一层设置为b
×n×
1卷积层，b表示批次数，n表示输入维度，如果是预测晶格常数，最后一层设置全连接层（连接层）；s406、设置阈值，根据阈值判断学习过程是向前推进还是循环重复学习，若两个模块学习后的差值绝对值小于阈值，立刻把输出y1，y2
ꢀ…
， yt传送到最后卷积层；若两个模块学习后的差值绝对值大于阈值，则把输出y1，y2
ꢀ…
， yt反向输送到第二个模块继续学习，直到最后绝对值小于阈值再传送到最后的卷积层（决策层）；s407、调节模型的超参数做局部优化，并且选择合适的损失函数(均方误差、平均绝对误差、平滑平均绝对误差、分位数损失)。
13.作为本发明的进一步优化方案，所述s401中的自注意力机制通过以下矩阵运算获得：
ꢀꢀ
（9）其中，softmax=, z是一个向量，zi、zj 是一个元素；q、k、v都源于输入特征本身的特征矩阵，能够让网络看到全局特征信息，提升模型的特征学习能力。q是特征的查询向量、k是特征被查寻向量、v是特征的内容向量。
14.作为本发明的进一步优化方案，所述s401中一维的resnet残差块，计算过程如下：
ꢀꢀꢀꢀꢀ
（10）式中x表示流入该层的输入向量，y表示该层流出的输出向量为卷积运算后的映射向量，并且改变了卷积核高度h始终为1。
15.作为本发明的进一步优化方案，所述s4中动态调节比例因子γ使得模型训练后测试集的相关系数r2最佳。
16.本发明的有益效果在于：1、本发明克服了现有获得钙钛矿晶格常数技术的不足，在不需要任何人工干预的情况下，可以大规模自动化快速地获得相当精确的钙钛矿晶格常数，并且可以识别出钙钛矿晶体材料空间群。通过键价向量和bvvs、原子体系总动能e
kin
、热膨胀系数α等原子尺度特征描述符，仅仅通过提供组成钙钛矿的元素特征就可以高效地筛选出想要的钙钛矿材料。
17.2、本发明的预测方法在整个过程中不涉及实验和不使用化学用品，不产生化学污染，符合绿色环保理念，易于实现，适合推广应用。
18.3、本发明原始数据来自多方面，克服单一数据来源的不足，并且可以预测各种结构的钙钛矿晶格常数和识别各种钙钛矿材料的空间群。通过设置比例因子，极大的优化了不同数据源给模型带来的影响。
附图说明
19.图1为本发明的流程框图。
20.图2为实施例1钙钛矿自适应的adarnn神经网络算法模型预测晶格常数a结果图。
21.图3为实施例2钙钛矿自适应的adarnn神经网络算法模型预测晶格常数b结果图。
22.图4为实施例2钙钛矿自适应的adarnn神经网络算法模型预测晶格常数c结果图。
23.图5 为实施例2钙钛矿自适应的adarnn神经网络算法模型识别钙钛矿晶体材料空间群的混淆矩阵。
具体实施方式
24.下面结合附图对本技术作进一步详细描述，有必要在此指出的是，以下具体实施方式只用于对本技术进行进一步的说明，不能理解为对本技术保护范围的限制，该领域的技术人员可以根据上述申请内容对本技术作出一些非本质的改进和调整。
25.实施例1在本实施例中，参见图1，一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法，包括如下步骤：1)数据采集：分别采集包括立方、正交、四方、六方、单斜和三斜晶体结构的钙钛矿材料晶格常数及相关特征共计23个特征的实验数据、数据库数据、已发表的论文数据，数据库为materials project、icsd数据；钙钛矿材料采集的数据特征变量如表1：
2)数据筛选：根据公式（1）计算出每种钙钛矿goldschmid容忍因子值，筛选0.8《t≤1.0 范围内的所有数据作为样本数据。
26.ꢀꢀꢀꢀꢀꢀꢀ
（1）式中，ra、rb和r
x
分别是abx3型钙钛矿材料中a位、b位和x位的有效离子半径。在理想的立方相钙钛矿结构中，t值等于1。一般情况下，在 0.8《t《1.0 的范围内，钙钛矿均可以形成。
27.3）在所述步骤2)中，根据公式(2)、(3)、(4)计算出每个abx3钙钛矿的键价向量和(bvvs)，具体计算公式如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（2）
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（3）
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（4）式中，b是一个常量为0.37
ꢀå
，r0与原子或离子类型有关的经验常数，为原子i和原子j之间的键价，为原子i和原子j之间的键长，是原子i指向原子j的单位向量，为原子价态，即键价向量和bvvs；根据分子动力学模拟分别计算出abx3型钙钛矿中n个原子体系总动能e
kin
，具体为：
ꢀꢀꢀꢀꢀꢀꢀꢀ
（5）式中，n为原子个数，mi为第i个原子的质量，vi为第i个原子的速度；根据公式（6）计算晶体的热膨胀系数α：
ꢀꢀꢀꢀ
（6）式中，κ为波尔滋蔓常数，z、m分别为阳离子化合价和配位数，u（ab）为晶格能，δ为原子序数相关常数，β为与结构类型相关参数。
28.分别从原子尺度的化学键与原子价态、动力学和热力学角度来表征晶格常数的变化，可以反映abx3型化合物bx6八面体畸变的结构特征的变量，并应用对未知型化合物形成钙钦矿结构的晶格常数进行预测。
29.4)将在所述步骤2)中，数据中添加上步骤3)计算得出的bvvs、n个原子体系总动能e
kin
、晶体的热膨胀系数α，再对实验数据、数据库数据、已发表的论文数据设置一个比例因子γ，初始化为5：3：2，然后按照比例因子对数据进行拼接汇总，最后把拼接好的数据打乱顺序，随机划分出90%的训练集和10%的测试集。
30.5)采用改进的adarnn神经网络算法对将在所述步骤4)中的汇总数据进行训练，并且动态调节比例因子γ使得模型训练后测试集的相关系数r2最佳。改进的adarnn神经网络算法如下：s1、构建原始rnn层，输入x1，x2 ，
…
，xt，对应隐藏状态h1，h2
ꢀ…
，ht，输出y1，y2
ꢀ…
， yt，运算过程可以表示为：
ꢀꢀꢀꢀꢀꢀꢀꢀ
（7）
ꢀꢀꢀꢀꢀꢀ
（8）其中，u、w、v、b、c均为参数，而f表示激活函数，具体为tanh函数；s2、构建第一个模块，即由五块带有自注意力机制的一维的resnet残差块连接组成，残差块中的卷积层全部替换成全连接层（学习层）；自注意力机制通过以下矩阵运算获得：
ꢀꢀꢀꢀ
（9）
其中，softmax=, z是一个向量，zi、z
j 是一个元素；q、k、v都源于输入特征本身的特征矩阵，能够让网络看到全局特征信息，提升模型的特征学习能力。q是特征的查询向量、k是特征被查寻向量、v是特征的内容向量。
31.一维的resnet残差块，计算过程如下：
ꢀꢀꢀꢀꢀꢀꢀꢀ
（10）式中x表示流入该层的输入向量，y表示该层流出的输出向量，为卷积运算后的映射向量，并且改变了卷积核高度h始终为1。
32.s3、构建第二个模块，即采用gru和lstm串接连接组成的单元（强化记忆层）；s4、构建第三个模块，即2层cnn模块，卷积核为1x1；s5、把上述模块一、模块二并联起来，并且纵向用模块三串联起这两个模块，最后整体串联到rnn上，如果是识别空间群最后一层设置为b
×n×
1卷积层，b表示批次数，n表示输入维度，如果是预测晶格常数，最后一层设置全连接层（连接层）；s6、设置阈值，根据阈值判断学习过程是向前推进还是循环重复学习，若两个模块学习后的差值绝对值小于阈值，立刻把输出y1，y2
ꢀ…
， yt传送到最后卷积层；若两个模块学习后的差值绝对值大于阈值，则把输出y1，y2
ꢀ…
， yt反向输送到第二个模块继续学习，直到最后绝对值小于阈值再传送到最后的卷积层（决策层）；s7、调节模型的超参数做局部优化，并且选择合适的损失函数。
33.本实施例采用一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法，对三种不同来源的钙钛矿样本数据进行了建模，建立了一种可以大规模自动化快速地获得相当精确的钙钛矿晶格常数的模型。
34.最终钙钛矿晶格常数a预测值和实验值r2相关系数为0.887，均方误差mse为0.113，平均绝对误差mae为0.216。
35.其中r2、mse、mae计算如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（11）
ꢀꢀꢀꢀꢀꢀ
（12）
ꢀꢀꢀꢀꢀꢀ
（13）其中n表示样本数，yj表示真值，表示预测值，表示平均值。
36.本实施例方法克服了现有获得钙钛矿晶格常数技术的不足，在不需要任何人工干预的情况下，可以大规模自动化快速地获得相当精确的钙钛矿晶格常数。仅仅通过提供组成钙钛矿的元素特征就可以高效地率筛选出想要的钙钛矿材料。
37.实施例2
本实施例与实施例一基本相同，特别之处在于：本实施例方法利用建立的钙钛矿晶格常数的预测模型对晶格常数b、c测试集中的样本进行预测并且识别其所属空间群，得到了较好的效果。本发明上述实施例涉及一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法，其步骤如下：（1）分别采集包括立方、正交、四方、六方、单斜和三斜晶体结构的钙钛矿材料晶格常数及元素特征的实验数据、数据库materials project、icsd数据、已发表的论文数据，经过筛选后获得原始数据集；其中筛选的具体步骤如下：根据公式(1) 计算出每种钙钛矿goldschmid容忍因子值t，筛选0.8《t≤1.0 范围内的所有数据作为原始数据集；
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（1）式中，ra、rb和r
x
分别是abx3型钙钛矿材料中a位、b位和x位的有效离子半径。在理想的立方相钙钛矿结构中，t值等于1。一般情况下，在 0.8《t《1.0 的范围内，钙钛矿均可以形成。
38.（2）在所述原始数据集的基础上，计算每种abx3型钙钛矿的键价向量和bvvs、n个原子体系总动能e
kin
和晶体的热膨胀系数α，将上述参数共同作为特征描述符；其中，钙钛矿键价向量和bvvs的具体计算公式如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（2）
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（3）
ꢀꢀꢀꢀꢀꢀꢀꢀ
（4）式中，b是一个常量为0.37
ꢀå
，r0与原子或离子类型有关的经验常数，为原子i和原子j之间的键价，为原子i和原子j之间的键长，是原子i指向原子j的单位向量，为原子价态，即键价向量和bvvs；所述s2中n个原子体系总动能e
kin
的计算过程为：根据分子动力学模拟分别计算出abx3型钙钛矿中n个原子体系总动能e
kin
，具体为：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（5）式中，n为原子个数，mi为第i个原子的质量，vi为第i个原子的速度；所述s2中晶体的热膨胀系数α的计算过程为：
ꢀꢀꢀꢀ
（6）式中，κ为波尔滋蔓常数，z、m分别为阳离子化合价和配位数，u（ab）为晶格能，δ为
原子序数相关常数，β为与结构类型相关参数。
39.分别从原子尺度的化学键与原子价态、动力学和热力学角度来表征晶格常数的变化。可以反映abx3型化合物bx6八面体畸变的结构特征的变量，并应用对未知型化合物形成钙钦矿结构的晶格常数进行预测。
40.（3）基于所述第一数据集和所述分子描述符构建训练集和测试集；具体为：s301、将分子描述符加入第一数据集获得样本数据集，再对实验数据、数据库数据、已发表的论文数据不同来源的数据设置比例因子γ，初始化为5：3：2；s302、按照比例因子γ对数据进行拼接汇总，把拼接好的数据打乱顺序，随机划分出90%的训练集和10%的测试集。
41.（4）基于adarnn神经网络算法模型构建晶格常数预测模型，根据s2的训练集和测试集对所构建的晶格常数预测模型进行训练，得到训练好的晶格常数预测模型和识别钙钛矿晶体材料的识别模型；具体包括以下步骤：s401、构建原始rnn层，输入x1，x2 ，
…
，xt，对应隐藏状态h1，h2
ꢀ…
，ht，输出y1，y2
ꢀ…
， yt，运算过程可以表示为：
ꢀꢀꢀꢀꢀꢀ
（7）
ꢀꢀꢀꢀꢀ
（8）其中，u、w、v、b、c均为参数，而f表示激活函数，具体为tanh函数；s402、构建第一个模块，即由五块带有自注意力机制的一维的resnet残差块连接组成，残差块中的卷积层全部替换成全连接层（学习层）；自注意力机制通过以下矩阵运算获得：
ꢀꢀꢀꢀꢀꢀꢀ
（9）其中，softmax=, z是一个向量，zi、z
j 是一个元素；q、k、v都源于输入特征本身的特征矩阵，能够让网络看到全局特征信息，提升模型的特征学习能力。q是特征的查询向量、k是特征被查寻向量、v是特征的内容向量。
42.一维的resnet残差块，计算过程如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（10）式中x表示流入该层的输入向量，y表示该层流出的输出向量，为卷积运算后的映射向量，并且改变了卷积核高度h始终为1。
43.s403、构建第二个模块，即采用gru和lstm串接连接组成的单元（强化记忆层）；s404、构建第三个模块，即2层cnn模块，卷积核为1x1；s405、把上述模块一、模块二并联起来，并且纵向用模块三串联起这两个模块，最后整体串联到rnn上，如果是识别空间群最后一层设置为b
×n×
1卷积层，b表示批次数，n表示输入维度，如果是预测晶格常数，最后一层设置全连接层（连接层）；s406、设置阈值，根据阈值判断学习过程是向前推进还是循环重复学习，若两个模
块学习后的差值绝对值小于阈值，立刻把输出y1，y2
ꢀ…
， yt传送到最后卷积层；若两个模块学习后的差值绝对值大于阈值，则把输出y1，y2
ꢀ…
， yt反向输送到第二个模块继续学习，直到最后绝对值小于阈值再传送到最后的卷积层（决策层）；s407、调节模型的超参数做局部优化，并且选择合适的损失函数。
44.在s4中，采用改进的自适应的强化版adarnn神经网络对将在所述s3中的汇总数据进行训练，并且动态调节比例因子γ使得模型训练后测试集的相关系数r2最佳。
45.（5）针对待预测的钙钛矿材料，利用训练好的晶格常数预测模型预测该钙钛矿材料的晶格常数并识别其空间群。
46.钙钛矿晶格常数b、c预测值和真实值的相关系数（r2）分别为0.875、0.873，均方误差（mse）分别为0.358、0.589，平均绝对误差（mae）分别为0.228、0.301。空间群识别准确率为95.5%。晶格常数b、c测试集预测结果如图3和图4所示，空间群识别混淆矩阵如图5所示。其中r2、mse、mae计算如下：
ꢀꢀꢀꢀꢀ
（11）
ꢀꢀꢀꢀꢀ
（12）
ꢀꢀꢀꢀꢀ
（13）其中n表示样本数，yj表示真值，表示预测值，表示平均值。
47.本发明在现有技术的基础上，克服了效率低的不足，提升了获得钙钛矿晶格常数的精确性，提出了一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法，在不需要任何人工干预的情况下，可以大规模自动化快速地获得相当精确的钙钛矿晶格常数，并且可以高效准确识别出钙钛矿晶体材料的空间群。
48.本发明的预测方法在整个过程中不涉及实验和不使用化学用品，不产生化学污染，符合绿色环保理念，易于实现，适合推广应用。本发明原始数据来自多方面，克服单一数据来源的不足，并且根据预训练模型设置了数据来源的比例，极大提高了深度学习模型的预测精准度。
49.以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种治疗皮肤疾病的复方精油和含有其的药物组合物的制作方法

一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法

相关文献

最热文献