一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于机器学习的固体灰渣溯源预测方法

2022-04-30 08:28:16 来源:中国专利 TAG:


1.本发明涉及固体灰渣利用技术领域,具体地说,涉及一种基于机器学习的固体灰渣溯源预测方法。


背景技术:

2.随着我国经济水平的不断提高,环境问题日益凸现出来,2017年,国家修订大气污染防治法等对环境治理提出了新的要求,而固体灰渣治理对于环境治理至关重要。近年来,固体灰渣的综合利用越发备受关注,不仅可以减少占地,也缓解了其对生态环境造成的污染,同时还可以创造可观的经济效益。由于固体灰渣具有特殊的物化性质以及富含多种有用组分,被广泛应用于有用组分提取、高附加值利用、建筑材料、农业和环保等领域。而固体灰渣溯源是是固体灰渣利用的重要环节。固体灰渣溯源有利于对固体灰渣进行大规模的分类处理和应用,大大节约了固体灰渣利用的成本,为实现以上目标,固体灰渣的溯源意义重大。
3.目前,大量关于固体灰渣溯源的实验研究已经开展,使得我们对固体灰渣成分与源头的关系有了初步了解。尽管大量的研究成果发表于国际高水平期刊上,目前的实验结果却仍未能准确的对固体灰渣及逆行溯源。因为不同来源固体灰渣的特殊性,在溯源前需要进行大量的实验研究,消耗了大量的人力和物力。同时,现有的针对具体固体灰渣的实验数据不断积累,然而并没有得到充分的利用。现阶段迫切需要提出切实可行的新方法,新手段,深入、系统地挖掘已有的固体灰渣数据。鉴于此,克服该现有技术所存在的缺陷,快速准确得到固体灰渣来源是本技术领域亟待解决的问题。


技术实现要素:

4.本发明的内容是提供一种基于机器学习的固体灰渣溯源预测方法,其能够克服现有技术的某种或某些缺陷。
5.根据本发明的一种基于机器学习的固体灰渣溯源预测方法,其包括以下步骤:
6.p1:收集固体灰渣数据作为机器学习模型的数据集;
7.p2:数据集预处理;
8.p3:利用机器学习训练数据并建立固体灰渣溯源预测模型;
9.p4:根据模型,对未知源头的固体灰渣进行预测,得到最终的预测结果作为固体灰渣的溯源结果。
10.作为优选,步骤p1中具体包括以下步骤:
11.p11:获取固体灰渣样品;
12.p12:确定不同源头固体灰渣的成分和性质,包括但不限于溶解性、密度、烧失量、氯离子含量、含水率、比表面积、氧化物含量;
13.作为优选,步骤p2中具体包括以下步骤:
14.p21:对数据进行标准化处理;其中数据标准化的方法包括但不限于极差标准化
法、线性比例标准化法、z-score标准化法;
15.p22:将标准化后的数据集划分为训练集和测试集两部分;其中数据集划分方法包括但不限于随机划分、kennard-stone划分、分层抽样划分。
16.作为优选,步骤p3中具体包括以下步骤:
17.p31:选择机器学习算法,所述机器学习算法包括但不限于决策树,随机森林,神经网络,逻辑回归,支持向量机;
18.p32:确定机器学习算法的超参数,超参数的确定在训练集上进行,确定方法包括但不限于经验法、网格搜索法以及优化算法,同时进行交叉验证;
19.p33:用确定超参数后的机器学习算法在整个训练集上建立固体灰渣溯源模型,并用测试集判断模型的可靠性,评价指标包括但不限于准确率accuracy、精确率precision、真正率tpr、假正率fpr、召回率recall、f1分数f1-score,计算公式如下:
[0020][0021][0022][0023][0024]
其中,tp表示正确的正例;fn表示错误的反例;fp表示错误的正例;tn表示正确的反例。
[0025]
作为优选,步骤p4中具体包括以下步骤:
[0026]
p41:确定待预测固体灰渣成分和性质;
[0027]
p42:使用已训练的机器学习模型对该固体灰渣进行溯源预测。
[0028]
通过对实际工程中固体灰渣成分的分析与利用,使用机器学习对固体灰渣成分进行学习,能够迅速、准确地进行固体灰渣溯源。该方法可准确预测出固体灰渣的来源,且精准度和准确度较高,且模型使用时操作简便,在运算效率、分析能力上都强于传统方法。能够广泛应用于工程实际,为后续固体灰渣的处理和利用提供依据
附图说明
[0029]
图1为实施例1中一种基于机器学习的固体灰渣溯源预测方法的流程图;
[0030]
图2为实施例2中溯源预测结果示意图。
具体实施方式
[0031]
为进一步了解本发明的内容,结合附图和实施例对本发明作详细描述。应当理解的是,实施例仅仅是对本发明进行解释而并非限定。
[0032]
实施例1
[0033]
如图1所示,本实施例提供了一种基于机器学习的固体灰渣溯源预测方法,其包括
以下步骤:
[0034]
p1:收集已知来源的固体灰渣成分含量配比数据作为机器学习模型的数据集;
[0035]
步骤p1中具体包括以下步骤:
[0036]
p11:获取固体灰渣样品;
[0037]
p12:确定不同源头固体灰渣的成分和性质,包括但不限于溶解性、密度、烧失量、氯离子含量、含水率、比表面积、氧化物含量。
[0038]
p2:数据集预处理;
[0039]
步骤p2中具体包括以下步骤:
[0040]
p21:对数据进行标准化处理;其中数据标准化的方法包括但不限于极差标准化法、线性比例标准化法、z-score标准化法;
[0041]
p22:将标准化后的数据集划分为训练集和测试集两部分;其中数据集划分方法包括但不限于随机划分、kennard-stone划分、分层抽样划分。
[0042]
p3:利用机器学习训练数据并建立固体灰渣溯源预测模型;
[0043]
步骤p3中具体包括以下步骤:
[0044]
p31:选择机器学习算法,所述机器学习算法包括但不限于决策树,随机森林,神经网络,逻辑回归,支持向量机;
[0045]
p32:确定机器学习算法的超参数,超参数的确定在训练集上进行,确定方法包括但不限于经验法、网格搜索法以及优化方法,同时进行交叉验证;
[0046]
p33:用确定超参数后的机器学习算法在整个训练集上建立固体灰渣溯源模型,并用测试集判断模型的可靠性,评价指标包括但不限于准确率accuracy、精确率precision、真正率tpr、假正率fpr、召回率recall、f1分数f1-score、,计算公式如下:
[0047][0048][0049][0050][0051]
其中,tp(true positive)表示正确的正例,一个实例是正类并且也被判定成正类;fn(false negative)表示错误的反例,漏报,本为正类但判定为假类;fp(false positive)表示错误的正例,误报,本为假类但判定为正类;tn(true negative)表示正确的反例,一个实例是假类并且也被判定成假类。
[0052]
p4:根据模型,对未知源头的固体灰渣进行预测,得到最终的预测结果作为固体灰渣的溯源结果。
[0053]
步骤p4中具体包括以下步骤:
[0054]
p41:确定待预测固体灰渣成分;
[0055]
p42:使用已训练的机器学习模型对该固体灰渣进行溯源预测。
[0056]
通过对实际工程中固体灰渣成分的分析与利用,使用机器学习对固体灰渣成分进
行学习,能够迅速、准确地进行固体灰渣溯源。该方法可准确预测出固体灰渣的来源,且精准度和准确度较高,且模型使用时操作简便,在运算效率、分析能力上都强于传统方法。能够广泛应用于工程实际,为后续固体灰渣的处理和利用提供依据。
[0057]
实施例2
[0058]
实例:以城市生活垃圾底灰,城市生活垃圾飞灰,粉煤灰,污泥粉煤灰四种固体灰渣为例,通过一种利用机器学习对固体灰渣进行溯源的方法,进行固体灰渣溯源预测,以下进行详细说明。
[0059]
本实施例提供一种基于固体灰渣成分,利用机器学习对其进行溯源预测的方法,包括以下步骤p1-p4。
[0060]
p1:收集固体灰渣相关数据作为机器学习模型的数据集。
[0061]
具体包括:从城市垃圾燃烧厂、燃煤电厂等地收集城市生活垃圾底灰,城市生活垃圾飞灰,粉煤灰,污泥粉煤灰等四种固体灰渣总计310个样本,对四种类型固体灰渣分别进行物化性质分析,选取其中几种氧化物的含量作为待分析数据集,其中氧化物种类包括:sio2、al2o3、fe2o3、cao、mgo、na2o、k2o。
[0062]
p2:数据集的预处理;
[0063]
具体包括:将数据集进行线性比例归一化处理,使得所有数据处于(0,1)范围中。本实例使用分层抽样划分方法将整个数据集划分为训练集与测试集。本实例中,训练集占总数据集的70%,测试集占总数据集的30%。
[0064]
p3:利用机器学习训练数据并建立固体灰渣溯源预测模型;
[0065]
具体包括:本实例选取随机森林算法作为固体灰渣溯源预测的算法。利用5折交叉验证,pso粒子群优化算法确定随机森林的超参数。本步骤中,交叉验证的折数,超参数优化的方法以及判别标准可以根据数据集的改变进行调整。本实例中,使用准确率(accuracy)、精确率(precision)、召回率(recall)、auc(area under the curve of roc)作为判断预测精度的标准。本实例优化后随机森林超参数如下:设置每棵决策树使用的最大特征数max_features=0.401499393,决策树个数n_estimators=91,树的最大深度max_depth=9,一个中间节点要分枝所需要的最小样本量min_samples_split=5,一个叶节点需要的最小样本量min_samples_leaf=1,对以上溯源数据库进行训练,训练出的随机森林模型为本发明的溯源预测模型。
[0066]
p4:根据建立的模型,对未知源头的固体灰渣进行预测,得到最终的预测结果作为该固体灰渣的溯源结果。
[0067]
具体包括:使用整个训练集训练最优的随机森林,并测试该随机森林模型在测试集上的表现。本实例选取测试集中的预测结果作为该固体灰渣的溯源预测结果。使用该训练后的随机森林模型对测试集中的固体灰渣进行溯源预测,其结果如图2所示,在训练集上该随机森林预测的溯源结果与真实源头之间的accuracy可以到达0.915、precision可以达到0.925、recall可以达到0.986、auc面积可以达到0.989。可以发现预测值与真实值十分接近,这说明使用固体灰渣氧化物作为溯源的影响因素,利用机器学习预测其源头的方法是可行的。
[0068]
以上示意性的对本发明及其实施方式进行了描述,该描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。所以,如果本领域的普通技
术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献