一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于混合优化算法的污水处理溶解氧浓度预测方法

2023-08-05 12:09:56 来源:中国专利 TAG:


1.本发明涉及污水处理技术领域和人工智能技术领域,特别是涉及一种基于混合优化算法的污水处理溶解氧浓度预测方法。


背景技术:

2.随着我国推进工业化和城镇化,水资源形势严峻,污水治理势在必行。目前,cass工艺是城镇污水处理中应用较广泛的一种工艺。该工艺主要包括进水、曝气、静沉和滗水四个阶段。溶解氧浓度是污水处理中一个重要的指标,通常通过曝气来实现。曝气的成本占整个污水处理运行成本的60%左右。
3.污水处理中溶解氧浓度的预测具有重要的意义。在污水处理过程中,通常需要添加氧气来促进生物降解污染物,提高污水处理效率。对溶解氧浓度的预测可以帮助我们更好地控制氧气的添加量,确保处理效果和成本效益的平衡。此外,污水处理厂通常需要满足一定的出水标准,其中溶解氧浓度是一个重要的指标之一。通过对溶解氧浓度的预测,可以帮助污水处理厂更好地控制出水水质,避免对环境造成不良影响。


技术实现要素:

4.为了达到节能和提高污水处理效率的目的,本发明提供了一种基于混合优化算法的污水处理溶解氧浓度预测方法,该方法利用污水厂实际生产数据进行模型训练,能够准确预测污水处理过程中的溶解氧浓度,从而实现污水处理工艺的优化。
5.为实现上述目的,本发明采取如下的技术方案:
6.一种基于混合优化算法的污水处理溶解氧浓度预测方法,包括以下步骤:
7.步骤1:利用传感器采集污水厂的实际污水处理数据,并对所述实际污水处理数据依次进行数据补全、数据相关性分析、数据去噪以及数据归一化处理,得到处理后的数据,再将处理后的数据划分为训练集和测试集;
8.步骤2:构建多指标输入、单指标输出的长短期记忆神经网络预测模型,所述长短期记忆神经网络预测模型采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,其中输入的多指标为鼓风机出力、进水ph值、电导率以及水温,输出的单指标为未来一个时间点的溶解氧浓度;
9.步骤3:采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,输出最优的超参数集合,并保存生成的最优预测模型;
10.步骤4:将所述训练集输入到所述最优预测模型中进行训练,训练后得到预测结果;
11.步骤5:将所述测试集输入到所述最优预测模型中进行验证,验证后得到预测结果,验证时采用的评估指标包括拟合优度、均方误差以及平均绝对误差。
12.本发明的主要有益效果如下:
13.(1)本发明基于污水厂的实际污水处理数据,基于污水处理过程中的内在变化规
律及潜在影响因素,通过相关性分析筛选出影响因素并将其作为模型输入,提高了预测模型的准确性;
14.(2)本发明采用融合了粒子群算法(particle swarm optimization,pso)和遗传算法(genetic algorithm,ga)的混合优化算法寻找长短期记忆神经网络的最优解,从而在兼顾全局性和局部性的同时提高算法的优化能力,该混合优化算法自适应调整交叉概率、变异概率和粒子群算法的参数,通过迭代搜索最优参数,优化长短期记忆神经网络预测模型的参数,获得最优预测模型,使得最优预测模型具有更高的预测精度,同时该最优预测模型结构简单、实施高效、误差率小,在污水处理溶解氧浓度预测方面表现良好。
附图说明
15.图1为本发明其中一个实施例所述的一种基于混合优化算法的污水处理溶解氧浓度预测方法的流程图;
16.图2为长短期记忆神经网络预测模型的输入、输出之间的具体指标关系图;
17.图3为粒子群算法的流程图;
18.图4为遗传算法的流程图;
19.图5为长短期记忆神经网络的结构图。
具体实施方式
20.下面将结合附图及较佳实施例对本发明的技术方案进行详细描述。
21.在其中一个实施例中,如图1所示,本实施例提供一种基于混合优化算法的污水处理溶解氧浓度预测方法,该方法具体包括以下步骤:
22.步骤1:利用传感器采集污水厂的实际污水处理数据,并对采集的实际污水处理数据进行数据预处理,包括数据补全、数据相关性分析、数据去噪以及数据归一化。
23.数据补全:由于污水处理的水下生态环境较为复杂,传感器采集的数据可能存在缺失或异常,因此在预处理阶段对原始数据采用均值法对缺失值进行补充或对异常值进行替换。均值法公式如下所示:
[0024][0025]
其中xn为缺失值,x
n-1
为缺失值的左侧临近值,x
n 1
为缺失值的右侧临近值。
[0026]
数据相关性分析:为了降低数据维度,筛选出与溶解氧浓度相关的影响因素,通过皮尔逊相关系数法分析,选取影响污水处理溶解氧的主要影响因子作为模型的输入参数。
[0027][0028]
式中x为溶解氧浓度,y为影响因素,p表示数据总量个数,最终得出相关性较大的影响因素,结果越接近1或者-1表示两个变量的线性相关性越强,越接近0表示线性相关性越弱。
[0029]
数据去噪:为了降低噪声的干扰,本发明选取了一种可以高效抑制噪声的sg滤波方法对数据进行去噪,它可以提高信号的信噪比。
[0030]
数据归一化:按照一定的比例对样本数据进行缩放,使其落入特定的范围内,减少因数据的绝对值对预测模型产生的不良影响,加快预测模型的训练速度提升预测模型的精度。归一化计算公式如下:
[0031][0032]
其中,x为归一化前的值,xk为经过归一化的值,x
max
为最大值,x
min
为最小值。
[0033]
数据集的划分:经过上述数据补全、数据相关性分析、数据去噪以及数据归一化处理后,得到处理后的数据,将处理后的数据按照8∶2的比例划分为训练集和测试集,训练集用于训练模型,找出预测模型的最优解,测试集对训练模型进行性能评估。
[0034]
步骤2:构建多指标输入、单指标输出的长短期记忆神经网络预测模型。如图2所示选取多指标输入、单指标输出;同时本发明将鼓风机出力、进水ph值、电导率以及水温做为输入,预测未来一个时间点(输出)的溶解氧浓度。
[0035]
步骤3:采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,输出最优的超参数集合,并保存生成的最优预测模型。
[0036]
本实施例提出了一种混合优化算法,基于粒子群算法和遗传算法的优缺点,将二者相融合。发挥出遗传算法全局性好的优点,粒子群算法局部搜索强的优点,进而得到更优的神经网络超参数。具体步骤如下:
[0037]
初始化:需要进行初始化的参数有:种群u的粒子个数m、算法的最大迭代次数n、粒子群优化算法中的初始速度vi和位置xi、最大速度v
max
、惯性权重ω、学习因子c1和c2,遗传算法中的交叉概率pc、变异概率pm等参数。
[0038]
粒子群迭代:用单一的粒子群算法进行寻优,将每个粒子的位置和速度信息不断进行更新,并根据预先设定好的优化要求选取合适的适应度函数。
[0039]
粒子分类:根据适应度函数得到每个粒子的适应度,根据适应度对粒子进行评价,将评价后的粒子,按照适应度值的高低进行排序,一分为二,将高的部分定义为子种群u1,低的部分定义为子种群u2。
[0040]
引入遗传算法:将子种群u1定义为适应度好的种群,直接保留进入到下一代,将u2定义为适应度差的种群,通过概率将一部分的粒子随机挑选出来通过变异概率pm进行变异。变异后新产生的粒子再次根据适应度函数进行评价,评价较好的进行保留。
[0041]
更新极值:引入遗传算法后,每个粒子都产生一个新的适应度值,将其和原本的个体极值pbesti做对比,如果优于原本的个体极值则进行替换。如果出现某个个体极值与全局极值gbest相比更优越也进行替换。
[0042]
算法循环寻优:若粒子的迭代次数达到最大值或者适应度达到预先设定的要求,则此时输出的全局极值就是神经网络的最优解。若未达到设定要求则继续循环,直至找到最优解。
[0043]
本实施例中的长短期记忆神经网络预测模型采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,以提高污水处理过程中溶解氧浓度的预测精度。其中采用基于粒子群算法和遗传算法相结合的混合优化算法寻找长短期记忆神经网络的最优解,输出最优的超参数集合的过程具体包括以下步骤:
[0044]
步骤3.1:进行参数初始化以及定义目标函数与适应度函数,需要进行初始化的参
数有:种群u的粒子个数m,算法的最大迭代次数n,粒子群优化算法中的初始速度vi和位置xi,最大速度v
max
,惯性权重ω,学习因子c1和c2,遗传算法中的交叉概率pc和变异概率pm;
[0045]
步骤3.2:初始化粒子种群后,使用粒子群算法进行寻优,并且粒子群算法采用非线性变化的惯性权重策略和异步变化的学习因子策略进行寻优,满足终止条件后,输出局部最优解;
[0046]
步骤3.3:在粒子群算法的基础上引入遗传算法,遗传算法采用自适应的交叉概率和变异概率策略对粒子进行选择、交叉、变异操作,满足终止条件后,输出全局最优解,即为最优的超参数集合。将最优的超参数集合代入到长短期记忆神经网络预测模型中,生成并保存最优预测模型。
[0047]
本实施例采取的粒子群算法的流程图如图3所示,粒子群算法以鸟类的群体行为作为灵感,基于成员之间的相互协作和共享信息。在鸟类觅食的过程中,搜索到距离食物最近的鸟,以它们当前所在的区域进行高效的捕食,从而实现了群体进化。
[0048]
该算法的具体流程为将粒子群的参数(粒子的位置和速度)进行初始化,选择均方误差(mse)作为适应度函数,计算出每个粒子的适应度值。将粒子群中的个体极值以及全局极值进行更新,将迭代后粒子的速度与位置进行更新,对算法进行判断,看是否达到终止条件即是否达到目标函数的收敛精度或者达到最大迭代次数,如果达到终止条件,最终输出的结果就是通过粒子群算法搜索到的局部最优解,没达到则重复上述步骤直至达到终止条件。
[0049]
粒子群算法把群体中的每个粒子通过位置、速度以及适应度值作为标签,这样每个粒子就可能是一个最优解,最后通过预先设计好的适应度函数来计算每个粒子的适应度值进行评价。
[0050]
粒子群算法描述为:在一个d维搜索空间,m个粒子构成的一个种群x={x1,x2,

,xm},其中xi=[x
i1
,x
i2
,

,x
id
],设t时刻xi的特征信息为:
[0051]
位置:
[0052][0053]
速度:
[0054][0055]
个体最优位置:
[0056][0057]
全局最优位置:
[0058][0059]
则该粒子在t 1时刻的速度和位置信息更新:
[0060][0061]
式中:ω为惯性权重,控制粒子在全局探测和局部开采间有效平衡;c1和c2为学习因子,分别调整飞向自身和全局最好方向的步长,基本上选取都为非负数;r1和r2为均匀分
布在[0,1]之间的随机数;分别对应的是当前时刻粒子的位置、速度、局部最优解以及全局最优解。
[0062]
传统的粒子群算法,它的参数都是设定好的,这样的一个缺点就是导致了不能做到局部性和全局性的平衡,在粒子群算法中,惯性权重w的选择对算法的精度和收敛性有着重要的影响。为了更好地探索搜索空间,本发明采用非线性变化的惯性权重策略。具体来说,当目标值趋于一致或局部最优时,可以适当增加惯性权重,以增强搜索的跳跃性;当目标值分散时,可以适当减小惯性权重,以提高搜索的局部精度。另外,对于那些目标函数值优于平均目标值的粒子,应该采用较小的惯性权重来保护它们,防止其过早地跳出搜索空间;而对于那些目标函数值差于平均目标值的粒子,应该采用较大的惯性权重,以使它们向更好的搜索区域靠拢,从而提高整个算法的收敛速度和精度。
[0063]
在粒子群算法中,学习因子c1和c2的选择对算法的性能和收敛速度有着重要的影响。为了提高粒子的自我学习能力和全局搜索能力,本发明采用异步变化的学习因子策略。具体来说,在算法的初始阶段,我们可以选择较小的学习因子,以便粒子更加注重自我学习;而在算法的后期阶段,我们可以选择较大的学习因子,以增强粒子的社会学习能力,从而更好地探索全局最优解。这种策略能够使得算法具有较强的收敛性和全局搜索能力,从而更有利于找到全局最优解。
[0064]
所以本发明采用自适应调整参数的形式,表达式为:
[0065][0066]
在上述公式中:ω为惯性权重,ω
max
、ω
min
分别为惯性权重的最大值和最小取值,c1和c2为学习因子,c
1i
和c
1e
分别为自学习因子的初始参数、结束参数,c
2i
和c
2e
分别为社会学习因子的初始参数、结束参数,t
max
为最大迭代次数。
[0067]
接下来,在粒子群算法的基础上引入遗传算法,遗传算法的流程图如图4所示,遗传算法是仿照自然界中的自然选择以及生物进化,通过选择、交叉和变异等一系列操作,生成新种群的一种算法。
[0068]
该算法的具体流程为对lstm的超参数采取编码的手段进行处理,即将个体进行编码,然后对遗传算法的参数进行初始化。选择均方误差(mse)作为适应度函数,计算出每个粒子的适应度值。然后进行选择、交叉以及变异操作,判断算法的结束条件则是看输出的个体是否为想要寻找的最优解,是的话直接输出最优解,不是的话再次进行迭代直至达到结束条件为止。
[0069]
在遗传算法中,交叉概率和变异概率是重要的参数,它们直接影响着算法的搜索能力和收敛速度。为了在不同的搜索阶段获得更好的性能,我们可以采用自适应的交叉概率和变异概率策略。具体来说,当群体适应度值趋于一致或局部最优时,我们可以适当地增加交叉概率和变异概率,以更好地探索解空间;而当群体适应度值比较分散时,我们则可以
适当减小交叉概率和变异概率,以保持群体的多样性。
[0070]
此外,在自适应的交叉概率和变异概率策略中,适应度值高于群体平均适应度值的个体对应较低的交叉概率和变异概率,以保护这些优秀的个体能够进入下一代。而适应度值低于平均值的个体则对应较高的交叉概率和变异概率,以促使它们被淘汰。
[0071]
这种自适应的交叉概率和变异概率策略能够在保持群体多样性的同时,保证算法的收敛性,从而更好地找到全局最优解。此外,自适应遗传算法还能够提供相对于某个解的最佳交叉概率和变异概率,以进一步提高算法的性能。
[0072]
调整后的自适应表达式为:
[0073][0074][0075]
其中,f'为交叉操作中最优个体的适应度值,f为即将变异的个体适应度值,f
avg
为适应度的平均值,f
max
为适应度的最大值,这里设定p
c1
=0.9,p
c2
取[0.5,1]区间的值,p
m1
=0.1,p
m2
取[0.05,0.1]区间的值,即可实现自适应调整。
[0076]
通过上述ga-pso算法对lstm神经网络的学习率、隐含神经元个数、迭代次数以及时间步长这四个参数进行优化后,得到预测模型的最优超参数,进而得到最优预测模型。
[0077]
lstm神经网络具有能学习长距离时序依赖的优点,因此选来作为污水处理溶解氧浓度预测的模型。
[0078]
根据图5对lstm神经网络的结构进行公式表达,记忆单元与隐藏状态一起记忆序列数据的历史信息。记忆单元中的信息受3个门控单元的控制。遗忘门根据h
t-1
和x
t
删除记忆单元中的信息。遗忘门为:
[0079]ft
=σ(wf[h
t-1
x
t
]) bf[0080]
式中:σ()为sigmoid激活函数;wf为遗忘门权重;bf为遗忘门偏置。
[0081]
输入门根据h
t-1
和x
t
向记忆单元中新增信息,如下所示:
[0082]it
=σ(wi[h
t-1
x
t
]) bi[0083][0084]
式中:i
t
为需要记忆的信息;为候选记忆单元,用于更新记忆单元;wi和wc为输入门权重;bi和bc为输入门偏置。
[0085]
遗忘门和输出门计算完成后,更新记忆单元公式:
[0086][0087]
式中为哈达玛乘积。输出门根据h
t-1
,x
t
,c
t
,决定h
t

[0088][0089][0090]
式中:wo为输出门权重;bo为输出门偏置。
[0091]
步骤4:将训练集数据输入到最优预测模型中进行训练,最终得到预测结果。
[0092]
步骤5:利用先前划分好的测试集对最优预测模型进行验证,验证后得到预测结果,验证时采用的评估指标包括拟合优度(r2)、均方误差(rmse)以及平均绝对误差(mae)。经过验证后的最优预测模型用于实际对污水处理溶解氧浓度进行预测。
[0093]
r2的值越接近1,说明回归方程对观测值的拟合程度越好,预测值越接近实测值,公式如下所示:
[0094][0095]
rmse是均方根误差,用来衡量预测值真实值之间的偏差程度,数值越小说明构建的预测模型精度越高。公式如下所示:
[0096][0097]
mae是平均绝对误差,可以反映出实际预测误差的大小,数值越小说明误差越小。公式如下所示:
[0098][0099]
上述三个评价指标中,n表示测试集中数据的个数,yi代表真实值,代表预测值,为测试集数据的平均数。
[0100]
下面给出一个将本发明应用于某污水处理厂的实例,具体步骤如下:
[0101]
步骤一,数据预处理。污水厂的数据包括2021年4月1日~2021年9月30日,共采集了8640个时间点数据,其中包括了生产设备因素(鼓风机出力、生化池液位、管道阻力),环境因素(水温、大气压力、空气湿度),污水水质因素(进水cod、进水bod、进水ph值),以及其他因素(氧化还原电位、电导率)。在预处理阶段对原始数据采用均值法对缺失值进行补充或对异常值进行替换。公式如下所示:
[0102][0103]
其中xn为缺失值,x
n-1
为缺失值的左侧临近值,x
n 1
为缺失值的右侧临近值。
[0104]
通过皮尔逊相关系数法分析,选取影响污水处理溶解氧的主要影响因子作为模型的输入参数。
[0105]
[0106]
式中x为溶解氧浓度,y为影响因素,p表示数据总量个数。最终得出相关性较大的影响因素。最终选取鼓风机出力、进水ph值、电导率以及水温四个重要影响因素。
[0107]
数据去噪:选取了一种可以高效抑制噪声的sg滤波方法。
[0108]
据归一化:按照一定的比例对样本数据进行缩放,使其落入特定的范围内,减少因数据的绝对值对预测模型产生的不良影响,加快预测模型的训练速度提升预测模型的精度。
[0109][0110]
其中,x为归一化前的值,xk为经过归一化的值,x
max
为最大值,x
min
为最小值
[0111]
步骤二,取了多指标输入、单指标输出,同时本发明采取了历史24个时间点数据为输入,预测未来1个时间点输出,同时为模型训练划分训练集和测试集。在训练集上,使用ga和pso优化lstm模型的参数,得到最佳的模型结构和参数。在测试集上,计算预测值与实际值之间的误差,并评估模型的预测准确度。
[0112]
步骤三:本发明提出了一种混合优化算法,基于粒子群算法和遗传算法的优缺点,将二者相融合。发挥出遗传算法全局性好的优点,粒子群算法局部搜索强的优点,进而得到更优的神经网络超参数。再通过ga-pso算法对lstm神经网络的学习率、隐含神经元个数、迭代次数以及时间步长这四个参数进行优化,得到最佳的lstm模型即最优预测模型。
[0113]
传统的粒子群算法的参数都是设定好的,导致不能做到局部性和全局性的平衡,所以本发明采用自适应调整参数的形式,表达式为:
[0114][0115]
在上述公式中:ω为惯性权重,ω
max
、ω
min
分别为惯性权重的最大值和最小取值,c1和c2为学习因子,c
1i
和c
1e
分别为自学习因子的初始参数、结束参数,c
2i
和c
2e
分别为社会学习因子的初始参数、结束参数,t
max
为最大迭代次数。
[0116]
传统的遗传算法中交叉概率和变异概率都是固定值,本发明在此基础上进行了调整,调整后的自适应表达式为:
[0117]
[0118][0119]
其中,f'为交叉操作中最优个体的适应度值,f为即将变异的个体适应度值,f
avg
为适应度的平均值,f
max
为适应度的最大值,这里设定p
c1
=0.9,p
c2
取[0.5,1]区间的值,p
m1
=0.1,p
m2
取[0.05,0.1]区间的值,即可实现自适应调整。
[0120]
lstm是一种常用于时间序列预测的神经网络算法,其特点在于可以处理长期依赖性问题。相比于普通的前馈神经网络,lstm网络可以保存并利用历史数据中的信息,因此在处理时间序列数据时具有优势。因此在污水处理溶解氧预测上具有较强的优势。
[0121]
步骤四:将训练集输入到优化后的ga-pso-lstm模型即最优预测模型中进行训练,预测污水处理的溶解氧浓度,并将预测结果输出,对预测结果进行评估,根据预测误差进行模型参数和结构的优化。
[0122]
本发明主要目的是提高污水处理溶解氧预测模型的预测精度,所以选取均方误差(mse)作为适应度函数,在迭代过程中对粒子的好坏进行评价。适应度函数的计算公式如下所示:
[0123][0124]
其中,n是训练样本的个数,为第i个个体的预测输出值,yi为第i个个体的真实值。
[0125]
损失函数用来估计预测值与真实值的差别,损失函数越小,表示预测的结果越精准,更接近真实值。选取均方误差(mse)作为损失函数。损失函数的计算公式如下所示:
[0126][0127]
其中,n是训练样本的个数,f(xi)为模型的预测值,yi为样本的真实值。
[0128]
基于ga-pso-lstm的污水处理溶解氧预测是一个多阶段的建模过程,在考虑神经网络结构、参数搜索空间、数据分布和计算资源后,综合考虑以上几个方面,选择adam作为优化器,因为它可以自适应地调整学习率,并且可以有效地处理不同尺度的梯度,同时可以处理时间序列数据的多个季节性变化和趋势性变化。
[0129]
各层之间的激活函数选择为tanh函数。
[0130]
ga-pso-lstm模型的基本参数和超参数选取如表1所示:
[0131]
表1参数选取
[0132]
输入神经元数4输出神经元数1隐藏层神经元数(51,57)全连接层神经元数68学习率0.0063
迭代次数40时间步长42
[0133]
步骤五:用先前划分好的测试集对最优预测模型进行验证,评估指标采用拟合优度(r2)和均方误差(rmse)以及平均绝对误差(mae)。现有技术中的基于pso-lstm预测污水处理溶解氧浓度的方法和本发明提出的基于混合优化算法的污水处理溶解氧浓度预测方法的相关指标对比如表2所示:
[0134]
表2现有技术和本发明提出方法的相关指标对比
[0135] r2rmsemae现有方法0.75659.96456.9054本方法0.93746.03703.1965
[0136]
通过表2对比可知,本发明所中的基于ga-pso-lstm污水处理溶解氧预测模型综合了遗传算法、粒子群算法和lstm神经网络的优点,能够充分利用历史数据进行预测并具有较强的适应性和预测能力。通过ga-pso算法进行优化,寻找到神经网络的最优解。提高了神经网络的预测能力。此外,lstm神经网络适用于处理时间序列数据,能够自适应地学习数据的特征,从而具有较强的预测能力。该模型能够提高水质监测的准确性和实时性,有助于优化污水处理的过程和效果。
[0137]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0138]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表