一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

核电系统控制方法及装置与流程

2022-09-01 08:41:16 来源:中国专利 TAG:


1.本发明涉及控制技术领域,尤其涉及一种核电系统控制方法及装置。


背景技术:

2.核能是清洁、低碳、供能稳定和高能量密度的新能源。伴随着清洁能源的发展,通过有效控制核电,将核电与电网接轨,实现核能有效利用,成为备受关注的命题。然而,核动力系统是一个离散时间非线性复杂系统,其参数与系统状态纠缠在一起,而且,由于核反应堆模型具有高阶次特性,需要巨大的计算能力,给核工业的功率控制带来了许多困难。
3.目前的核电系统控制方法,主要集中在线性化过程,不能满足非线性过程的跟踪控制过程,应用场景较为局限,控制过程的误差较大,准确率较低。


技术实现要素:

4.本发明提供一种核电系统控制方法及装置,用以解决现有技术中的核电系统控制方法主要集中在线性化过程,不能满足非线性过程的跟踪控制过程,应用场景较为局限,控制过程的误差较大,准确率较低的缺陷,实现使得核电系统动作模型的训练更加充分,扩大核电系统控制方法的应用场景,降低控制过程的误差,提高准确率。
5.本发明提供一种核电系统控制方法,包括:获取核电系统运行参数;将所述核电系统运行参数输入至核电系统动作模型,确定所述核电系统动作模型输出的核电系统控制策略;其中,所述核电系统动作模型为在核电系统评价模型的指导下,基于核电系统样本参数进行迭代训练,直至达到目标迭代次数和目标收敛精度,得到最优控制策略的情况下更新为目标权值得到的。
6.根据本发明提供的一种核电系统控制方法,所述核电系统动作模型的训练过程包括:获取多个所述核电系统样本参数;开启全局循环,对所述核电系统动作模型的权值和所述核电系统评价模型的权值均进行初始化;开启局部循环,基于多个所述核电系统样本参数,向所述核电系统评价模型的相邻值函数之间的剩余误差变小的方向进行迭代操作,直至迭代次数达到所述目标迭代次数,得到迭代控制律以及所述核电系统动作模型输出的局部最优控制策略和所述核电系统评价模型输出的局部最优性能指标函数;基于所述局部最优控制策略更新所述核电系统动作模型的权值,基于所述局部最优性能指标函数更新所述核电系统评价模型的权值,迭代所述全部循环和所述局部循环,直至所述核电系统动作模型达到目标收敛精度,确定所述最优控制策略,将所述最优控制策略下对应的权值设定为所述核电系统动作模型的目标权值。
7.根据本发明提供的一种核电系统控制方法,所述对所述核电系统动作模型的权值和所述核电系统评价模型的权值均进行初始化,包括:基于随机赋值的方法,在预设权值区间(-0.1,0.1)内,对所述核电系统动作模型的权值和所述核电系统评价模型的权值进行初始化。
8.根据本发明提供的一种核电系统控制方法,所述核电系统评价模型的权值的更新
方法为:
[0009][0010][0011]
其中,w
vi
为第i次迭代时的所述核电系统评价模型的权值,为第i次迭代时所述核电系统评价模型的值函数;εk,ui分别为系统跟踪误差和控制器控制变量。
[0012]
根据本发明提供的一种核电系统控制方法,所述局部最优性能指标函数为:
[0013][0014][0015]
εk=f(xk) g(xk)u
k-x
d,k

[0016]
xk=f(x
k-1
) g(x
k-1
)u
k-1

[0017]
x
d,k
=f(x
d,k-1
) g(x
d,k-1
)u
d,k-1

[0018]uε,k
=u
k-u
d,k

[0019]
其中,为局部最优性能指标函数,u(εk,u
ε,k
)为效用函数,代表归一化后的系统跟踪误差和控制器误差之和,εk代表系统跟踪误差,f(x)、g(x)分别为离散化后的系统动态方程系数矩阵d,xk=f(x
k-1
) g(x
k-1
)u
k-1
表示核电系统离散化后的动态方程,x
d,k
为系统期望输出,u
ε,k
为控制器控制误差,q、r为标准矩阵。
[0020]
根据本发明提供的一种核电系统控制方法,所述核电系统动作模型的输入层节点数量为5,隐藏层节点数量为5,输出层节点数量为1;所述核电系统评价模型的输入层节点数量为5,隐藏层节点数量为15,输出层节点数量为1;所述目标收敛精度为1.0
×
10-5

[0021]
根据本发明提供的一种核电系统控制方法,所述核电系统运行参数包括:平均中子寿命、控制棒组的反应值、标称核能、第i组延迟中子的有效总比例、燃料与冷却剂之间的传热系数、冷却剂质量流的热容、冷却剂温度的反应系数、燃料温度的反应系数、冷却剂热容量、燃料热容量、等效单群延迟中子前驱体核衰变常数、核反应值、冷却剂进口平均温度、冷却剂的初始平衡入口温度、冷却剂的初始平衡出口温度、燃料初始平衡温度、相对于初始平衡密度的中子密度、相对于初始平衡密度的延迟中子密度、平均燃油温度、堆芯出口冷却液温度、控制棒运动所贡献的反应性和控制棒的速度中的至少一种。
[0022]
本发明还提供一种核电系统控制装置,该核电系统控制装置包括:获取模块,用于获取核电系统运行参数;确定模块,用于将所述核电系统运行参数输入至核电系统动作模型,确定所述核电系统动作模型输出的核电系统控制策略;其中,所述核电系统动作模型为在核电系统评价模型的指导下,基于核电系统样本参数进行迭代训练,直至达到目标迭代次数和目标收敛精度,得到最优控制策略的情况下更新为目标权值得到的。
[0023]
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述核电系统控制方法。
[0024]
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述核电系统控制方法。
[0025]
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述核电系统控制方法。
[0026]
本发明提供的核电系统控制方法及装置,通过在核电系统评价模型的指导下,根据核电系统样本参数进行迭代训练,在满足目标迭代次数和目标收敛精度,得到最优控制策略的情况时确定核电系统动作模型的目标权值,利用训练完成的核电系统动作模型来得到核电系统控制策略,这样使得核电系统动作模型的训练更加充分,扩大核电系统控制方法的应用场景,降低控制过程的误差,提高准确率。
附图说明
[0027]
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0028]
图1是本发明提供的核电系统控制方法的流程示意图;
[0029]
图2是本发明提供的核电系统控制方法的程序框图;
[0030]
图3是本发明提供的核电系统控制方法的原理示意图;
[0031]
图4是本发明提供的核电系统控制装置的结构示意图;
[0032]
图5是本发明提供的电子设备的结构示意图。
具体实施方式
[0033]
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0034]
下面结合图1-图5描述本发明的核电系统控制方法及装置
[0035]
如图1所示,本发明提供一种核电系统控制方法,该核电系统控制方法包括如下步骤110至步骤120。
[0036]
步骤110、获取核电系统运行参数。
[0037]
可以理解的是,核电系统运行参数可以为核电的功率模型系统参数,核电系统运行参数可以包括:平均中子寿命、控制棒组的反应值、标称核能、第i组延迟中子的有效总比例、燃料与冷却剂之间的传热系数、冷却剂质量流的热容、冷却剂温度的反应系数、燃料温度的反应系数、冷却剂热容量、燃料热容量、等效单群延迟中子前驱体核衰变常数、核反应值、冷却剂进口平均温度、冷却剂的初始平衡入口温度、冷却剂的初始平衡出口温度、燃料初始平衡温度、相对于初始平衡密度的中子密度、相对于初始平衡密度的延迟中子密度、平均燃油温度、堆芯出口冷却液温度、控制棒运动所贡献的反应性和控制棒的速度中的至少一种。
[0038]
步骤120、将核电系统运行参数输入至核电系统动作模型,确定核电系统动作模型输出的核电系统控制策略。
[0039]
可以理解的是,核电系统动作模型可以为神经网络模型,在将核电系统运行参数
输入到核电系统动作模型之后,核电系统动作模型能够对核电系统运行参数进行处理,输出核电系统控制策略,核电系统控制策略的具体表现形式可以为控制律,也就是受控变量与系统输入信号之间的函数关系,核电系统控制策略可以用于调节核电系统跟踪误差,使系统输出响应快速高效地满足核电站的控制要求。
[0040]
其中,核电系统动作模型为在核电系统评价模型的指导下,基于核电系统样本参数进行迭代训练,直至达到目标迭代次数和目标收敛精度,得到最优控制策略的情况下更新为目标权值得到的。
[0041]
可以理解的是,核电系统评价模型可以用于对核电系统动作模型进行指导,本实施例采用了自适应动态规划方法,自适应动态规划方法使用由神经网络组成的控制器和评价器结构,通过近似的方法逼近误差值函数和误差控制策略。自适应动态规划方法利用函数近似结构来逼近动态规划方程中的最优性能指标函数和最优控制策略。自适应动态规划结构可以包括动态系统、核电系统动作模型和核电系统评价模型,核电系统评价模型用于近似最优代价函数,并给出评价指导核电系统动作模型产生最优控制策略。核电系统动作模型输出的最优控制策略作用于动态系统后,通过动态系统不同阶段产生的奖励或者惩罚来影响核电系统评价模型,直到核电系统动作模型更新控制策略,使得总体代价达到最优,总体代价为奖励和惩罚的总和。
[0042]
此处,核电系统样本参数可以是收集到的核电站在历史运行过程中产生的相关参数,可以利用大量的核电系统样本参数来训练核电系统动作模型和核电系统评价模型。
[0043]
可以利用核电系统样本参数来对核电系统动作模型和核电系统评价模型进行迭代训练,通过控制迭代训练的次数和迭代训练的精度后,核电系统动作模型和核电系统评价模型可以达到目标收敛精度,对应可以得到核电系统动作模型输出的最优控制策略。
[0044]
将最优控制策略情况下对应的权值设定为核电系统动作模型的目标权值,这样就能够得到相对准确的核电系统动作模型,从而能够通过自适应动态规划方法,在核电系统评价模型的指导下,快速训练出满足要求的核电系统动作模型。
[0045]
值得一提的是,此处在训练核电系统评价模型和核电系统动作模型的过程中,进行了双重限定,一方面限定迭代训练的次数,另一方面限定迭代训练后模型的精度,这样能够使得得到的核电系统动作模型的训练更加充分,精度更高。通过核电系统评价模型来指导核电系统动作模型的训练,在满足非线性控制的同时,也解决了其他控制策略中参数随系统功率变化的问题,能够扩大核电系统控制方法的应用场景,降低控制过程的误差,提高准确率。
[0046]
本发明提供的核电系统控制方法,通过在核电系统评价模型的指导下,根据核电系统样本参数进行迭代训练,在满足目标迭代次数和目标收敛精度,得到最优控制策略的情况时确定核电系统动作模型的目标权值,利用训练完成的核电系统动作模型来得到核电系统控制策略,这样使得核电系统动作模型的训练更加充分,扩大核电系统控制方法的应用场景,降低控制过程的误差,提高准确率。
[0047]
如图2和图3所示,在一些实施例中,核电系统动作模型的训练过程包括:获取多个核电系统样本参数;开启全局循环,对核电系统动作模型的权值和核电系统评价模型的权值均进行初始化;开启局部循环,基于多个核电系统样本参数,向核电系统评价模型的相邻值函数之间的剩余误差变小的方向进行迭代操作,直至迭代次数达到目标迭代次数,得到
迭代控制律以及核电系统动作模型输出的局部最优控制策略和核电系统评价模型输出的局部最优性能指标函数;基于局部最优控制策略更新核电系统动作模型的权值,基于局部最优性能指标函数更新核电系统评价模型的权值,迭代全部循环和局部循环,直至核电系统动作模型达到目标收敛精度,确定最优控制策略,将最优控制策略下对应的权值设定为核电系统动作模型的目标权值。
[0048]
可以理解的是,可以获取2500-mw pwr核电站核电系统的核电系统样本参数,并对核电系统样本参数进行初始化。同时可以对核电系统进行离散化以及相关转换。可以基于神经网络构建核电系统动作模型和核电系统评价模型,并对核电系统动作模型的权值和核电系统评价模型的权值进行初始化,以及设置核电系统动作模型的网络收敛精度和核电系统评价模型的网络收敛精度。
[0049]
此处是基于数据的自适应动态规划方法(adp,adaptive dynamic programming)进行构建,无需具体的数学模型,即利用自适应动态规划算法在处理和分析问题过程中根据处理数据的数据特征自动调整处理方法、处理顺序与处理参数,使其与问题特征相匹配的特点,调整优化2500-mw pwr核电站核电系统控制策略方法。以系统实际变量和期望变量的差值为目标函数,根据核电站系统的输出要求,利用基于自适应动态规划方法快速匹配系统最优控制策略。
[0050]
根据需求,2500-mw pwr核电站误差跟踪最优控制系统的初始阶段需要进行参数的初始化工作,为算法运行做好基础数据储备工作。核电系统样本参数可以包括:平均中子寿命λ(s)、控制棒组的反应值gr、标称核能p
0a
(mw)、第i组延迟中子的有效总比例β、燃料与冷却剂之间的传热系数o(mw
·
s/℃)、冷却剂质量流的热容m(mw
·
s/℃)、冷却剂温度的反应系数αc、燃料温度的反应系数αf、冷却剂热容量μc(mw
·
s/℃)、燃料热容量μf(mw
·
s/℃)、等效单群延迟中子前驱体核衰变常数λ、核反应值ρ、冷却剂出口平均温度te(℃)、冷却剂的初始平衡入口温度t
e0
(℃)、冷却剂的初始平衡出口温度t
l0
(℃)、燃料初始平衡温度t
f0
(℃)、相对于初始平衡密度的中子密度nr、相对于初始平衡密度的延迟中子密度cr、平均燃油温度tf、堆芯出口冷却液温度t
l
、控制棒运动所贡献的反应值ρr、控制棒的速度zr以及系统的全功率p0。
[0051]
核电系统样本参数对应的取值示例可以如表1所示。
[0052]
表1核电系统样本参数的取值示例
[0053][0054]
需要说明的是,在实例2500-mw pwr核电站系统中,系统的模型可以描述为:
[0055][0056]
其中,在2500-mw pwr核电站系统中,te近似等于t
e0
,系统的反应堆功率为p(t)=p
0a
nr,nr为系统全功率百分比因子,相关参数的值以及其之间的关系如上文所述。
[0057]
在训练开始阶段,需要进行系统参数初始化,全局循环与局部循环次数初始化以及网络结构初始化工作。可以预先设定全局循环的次数和局部循环次数,也就是目标迭代次数,并设置目标收敛精度为1.0
×
10-5

[0058]
值得一提的是,在本实施例中,初始化的系统输入状态变量为:x
60
=[0.6,0.6,530.8572,306.5198,-0.0047]
t
,期望输出为:x
80
=[0.8,0.8,594.0060,310.7468,-0.0018]
t

[0059]
初始化的网络结构为:核电系统动作模型的输入层节点数量为5,隐藏层节点数量为5,输出层节点数量为1;核电系统评价模型的输入层节点数量为5,隐藏层节点数量为15,输出层节点数量为1;目标收敛精度为1.0
×
10-5

[0060]
在其他实施例或应用中,核电系统动作模型和核电系统评价模型中的隐层节点数量可根据经验进行调整以获得最佳的逼近效果;对于效用函数,可以采用q=10i5×5,r=0.1i1×1,其中i为标准单位矩阵;跟踪误差初始随机设置为初始状态与期望输出轨迹的差值,每次迭代的控制周期可以为1s,迭代次数可以设置为50次。
[0061]
在一些实施例中,对核电系统动作模型的权值和核电系统评价模型的权值均进行初始化,包括:基于随机赋值的方法,在预设权值区间(-0.1,0.1)内,对核电系统动作模型的权值和核电系统评价模型的权值进行初始化。
[0062]
可以理解的是,开启全局循环后,可以通过随机赋值的方法初始化核电系统动作模型的权值和核电系统评价模型的权值。
[0063]
在本实施例中,需要对核电系统动作模型的权值和核电系统评价模型的权值进行初始化工作,在综合考虑了权值收敛速度与稳定性的情况下,在全局循环之内,为两个网络的权值w
cl
(l=1,2,....,15)、w
al
(l=1,2,....5),在设定的范围(-0.1,0.1)内通过随机赋值方法得到。其中,w
cl
为核电系统评价模型的输入层节点到隐藏层节点之间的权值,w
al
为核电系统动作模型的输入层节点到隐藏层节点之间的权值。
[0064]
核电系统评价模型和核电系统动作模型的权值初始化在全局循环之内,可以在每次全局循环开始时重新进行权值的初始化,从而在保证网络稳定性与收敛速度的基础上更好地实现神经网络的收敛,以便尽快找到核电系统的最优性能指标函数和最优控制策略。
[0065]
开启局部循环,基于初始化的相关参数,通过自适应动态规划方法训练权值赋值后的核电系统评价模型和核电系统动作模型,向网络最小化误差函数梯度下降方向,迭代进行网络权值的更新直至达到预设的目标迭代次数,也就是达到局部循环次数,获得迭代控制律,并通过局部循环后的核电系统评价模型和核电系统动作模型获取局部最优控制策略和局部最优性能指标函数。
[0066]
基于初始化的核电系统样本参数,nr为全功率百分比因子、cr为相对于初始平衡密度的延迟中子密度、tf为平均燃油温度、t
l
为堆芯出口冷却液温度、ρr为控制棒运动所贡献的反应值、zr为控制棒的速度,根据离散化定义,离散化后的核电系统可以描述成如下公式所示:
[0067]
x
k 1
=f(xk) g(xk)uk;
[0068]
其中,f(x)、g(x)为系统参数矩阵,u=zr为控制变量。
[0069]
系统期望输出轨迹为:
[0070]
x
d,k 1
=f(x
d,k
) g(x
d,k
)u
d,k

[0071]
定义系统参数的跟踪误差为:
[0072]
εk=x
k-x
d,k
=f(xk) g(xk)u
k-x
d,k

[0073]
控制器的误差可以定义为u
ε,k
=u
k-u
d,k
,则跟踪误差ε可以重写为:
[0074]
ε
k 1
=f
ε
(εk) g
ε,k
(εk)u
ε,k

[0075]
其中f
ε
(εk)=f(εk x
d,k
)-x
d,k 1
,g
ε,k
(εk)=g(εk x
d,k
)。
[0076]
因此,可以定义系统的效用函数为:
[0077][0078]
系统效用函数代表系统参数跟踪误差和控制器控制误差归一化后的总和,其中q、r为标准矩阵。
[0079]
根据系统效用函数,可以得到系统跟踪误差的损失函数为:
[0080][0081]
在一些实施例中,局部最优性能指标函数为:
[0082][0083][0084]
εk=f(xk) g(xk)u
k-x
d,k

[0085]
xk=f(x
k-1
) g(x
k-1
)u
k-1

[0086]
x
d,k
=f(x
d,k-1
) g(x
d,k-1
)u
d,k-1

[0087]uε,k
=u
k-u
d,k

[0088]
其中,为局部最优性能指标函数,u(εk,u
ε,k
)为效用函数,代表归一化后的系统跟踪误差和控制器误差之和,εk代表系统跟踪误差,f(x)、g(x)分别为离散化后的系统动态方程系数矩阵d,xk=f(x
k-1
) g(x
k-1
)u
k-1
表示核电系统离散化后的动态方程,x
d,k
为系统期望输出,u
ε,k
为控制器控制误差,q、r为标准矩阵。
[0089]
可以理解的是,根据最优性原理和哈密顿-雅可比-贝尔曼方程(hamilton-jacobi-bellman equation,简称hjb方程),可以得到误差系统最优的跟踪控制策略为:
[0090][0091]
由此,标准最优控制率为:
[0092][0093]
由上文可以推导出:
[0094]ud,k
=g-1
(x
d,k
)(x
d,k 1-f(x
d,k
))。
[0095]
为了获得最优控制策略,可以将跟踪误差函数重新定义为:
[0096][0097]
其中,根据贝尔曼最优化原理,上式满足贝尔曼方程:
[0098][0099]
由此,推导出最优控制策略为:
[0100][0101]
将最优的控制策略代入贝尔曼方程,便可得到误差跟踪性能指标函数:
[0102][0103]
根据上文所述,在2500-mw pwr核电站实例中,基于自适应动态规划方法的迭代规则为:
[0104]
[0105]
该公式为性能指标函数的更新法则。
[0106][0107]
该公式为控制策略的更新法则。可以证明,当迭代次数足够长时,性能指标函数趋于最优,并且与初始值无关。
[0108]
本实施例用到的自学习优化包括全局循环与局部循环,局部循环的目标是最小化每一个周期内的总代价,全局循环的目标是更新迭代性能指标函数和迭代控制律,以获得最优解,即最优控制策略。
[0109]
可以令i=0,1,2,

为全局循环变量,将性能指标函数进行初始化如:
[0110][0111]
其中,为正定函数。
[0112]
初始的迭代控制律如下式所示:
[0113][0114]
其中,
[0115]
因而,对于全局循环变量i=0,1,2,

,可以依据上文所示的公式进行迭代。
[0116]
在全局循环的基础上,引入局部循环以获得在实施例中,核电系统评价模型根据利用相邻两个性能指标函数的剩余误差进行权值更新。
[0117]
本实施例可以利用高阶多项式代替actor-critic神经网络中的神经元来获得性能指标函数和控制策略的近似解。其中,核电系统评价模型可以表示为:
[0118][0119]
其中为神经网络激活函数;为权重向量,l为隐藏层神经元个数。
[0120]
核电系统动作模型可以表示为:
[0121][0122]
其中,为神经网络权重,m为隐藏层神经元个数,为激活函数。
[0123]
在一些实施例中,核电系统评价模型的权值的更新方法为:
[0124]
[0125][0126]
其中,w
vi
为第i次迭代时的核电系统评价模型的权值,为第i次迭代时核电系统评价模型的值函数;εk,ui分别为系统跟踪误差和控制器控制变量。
[0127]
在局部循环中,核电系统评价模型的目的为最小化相邻值函数的剩余误差,由此可以获得一个新的目标函数,定义为:
[0128][0129]
得到核电系统评价模型的权重更新方法为:
[0130][0131]
核电系统动作模型的权重更新方法为:
[0132][0133]
可以更新后的迭代控制律替代当前迭代控制律,以局部最优性能指标函数替代当前性能指标函数,并重复执行上述步骤直至核电系统评价模型和核电系统动作模型满足目标收敛精度,获得2500-mw pwr核电站误差跟踪系统的最优控制策略。
[0134]
根据局部循环的设定迭代次数,若此时局部循环尚未结束,继续返回局部循环的起始处继续核电系统动作模型和核电系统评价模型的训练,若局部循环已经结束,则继续判断当前的全局循环是否结束,若全局循环尚未结束,则返回到局部循环的起始处重新对基于自学习的核电站误差跟踪控制方法进行初始化赋值,随后根据初始化结果利用actor-critic网络对系统效用函数进行调整;若全局循环已经结束,则获得最优核电系统控制策略。
[0135]
通过最优误差跟踪控制策略计算各时刻系统的效用函数,根据相应的结果更新性能指标函数和控制策略。本实施例不断寻找最优的离散时间非线性核电系统控制策略并保存相应的系统效用函数最小时的神经网络数据,直到网络训练结束。
[0136]
基于数据的控制算法最大的优点是无模型控制。实际系统存在严重的非线性、不确定性和时变性等因素,在无法获得精确的数学模型的情形下,无模型自适应优化控制便能发挥自身的优势,克服理论模型与实际应用之间的矛盾,降低了对模型的要求,并且有较好的综合控制效果。
[0137]
下面对本发明提供的核电系统控制装置进行描述,下文描述的核电系统控制装置与上文描述的核电系统控制方法可相互对应参照。
[0138]
如图4所示,本发明还提供一种核电系统控制装置,该核电系统控制装置包括:获取模块410和确定模块420。
[0139]
获取模块410,用于获取核电系统运行参数。
[0140]
确定模块420,用于将核电系统运行参数输入至核电系统动作模型,确定核电系统动作模型输出的核电系统控制策略。
[0141]
其中,核电系统动作模型为在核电系统评价模型的指导下,基于核电系统样本参数进行迭代训练,直至达到目标迭代次数和目标收敛精度,得到最优控制策略的情况下更
新为目标权值得到的。
[0142]
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(communications interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行核电系统控制方法,该方法包括:获取核电系统运行参数;将核电系统运行参数输入至核电系统动作模型,确定核电系统动作模型输出的核电系统控制策略;其中,核电系统动作模型为在核电系统评价模型的指导下,基于核电系统样本参数进行迭代训练,直至达到目标迭代次数和目标收敛精度,得到最优控制策略的情况下更新为目标权值得到的。
[0143]
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0144]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的核电系统控制方法,该方法包括:获取核电系统运行参数;将核电系统运行参数输入至核电系统动作模型,确定核电系统动作模型输出的核电系统控制策略;其中,核电系统动作模型为在核电系统评价模型的指导下,基于核电系统样本参数进行迭代训练,直至达到目标迭代次数和目标收敛精度,得到最优控制策略的情况下更新为目标权值得到的。
[0145]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的核电系统控制方法,该方法包括:获取核电系统运行参数;将核电系统运行参数输入至核电系统动作模型,确定核电系统动作模型输出的核电系统控制策略;其中,核电系统动作模型为在核电系统评价模型的指导下,基于核电系统样本参数进行迭代训练,直至达到目标迭代次数和目标收敛精度,得到最优控制策略的情况下更新为目标权值得到的。
[0146]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0147]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指
令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备)执行各实施例或者实施例的某部分所述的方法。
[0148]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献