一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于机器学习的混凝土工程量指标估算方法与流程

2022-04-14 03:08:43 来源:中国专利 TAG:


1.本发明涉及工程造价技术领域,特别的为一种基于机器学习的混凝土工程量指标估算方法。


背景技术:

2.随着房地产行业发展放缓,建筑市场的竞争也越发激烈,投标报价的时间期限也越来越短。混凝土的工程量指标估算可以为企业预算报价提供重要依据,其准确与否将直接影响企业的投资决策。如何快速、高效对混凝土的工程量指标进行估算对建筑企业提升技术水平、核心竞争力尤为重要。
3.传统混凝土工程量指标预测是利用人为经验,通过项目相似度匹配进行估算,即选取新项目的工程因素,再通过寻找相同或相类似因素的历史项目数据,对新项目的混凝土含量指标进行估算。这种预测方法时效性差,效率低下,在进行预测时,遇到没有历史项目参考的情况下指标估算工作无法进行。
4.综上所述,研发一种基于机器学习的混凝土工程量指标估算方法,仍是工程造价技术领域中急需解决的关键问题。


技术实现要素:

5.本发明提供的发明目的在于提供一种基于机器学习的混凝土工程量指标估算方法,能够快速、高效、智能化的预测新项目的混凝土工程量,缩短含量指标计算时间,提高效率,减少不必要的重复性工作。
6.为实现以上目的,本发明通过以下技术方案予以实现:一种基于机器学习的混凝土工程量指标估算方法,其特征在于,包括以下步骤:s1、根据影响混凝土工程量指标的工程概况因素构建混凝土工程量指标估算体系,采集历史项目工程中各单体混凝土工程量指标估算体系的原始数据;s2、对提取到的原始数据进行多重数据处理,构建原始样本数据集,将原始样本集按指定比例划分为训练数据集和测试数据集;s3、构建随机森林回归模型,将训练数据集作为模型输入,对原始样本数据集进行特征选择;s4、构建多层bp神经网络模型,将最优特征变量集作为多层bp神经网络模型的输入变量,对应混凝土工程量指标作为输出变量,对多层bp神经网络模型进行训练,并利用测试数据集对训练后的神经网络模型进行评估。
7.本发明进一步设置为:所述混凝土工程量指标估算体系包括单体工程概况和混凝土工程量指标。
8.本发明进一步设置为:在步骤s2中,对提取到的原始数据进行多重数据处理,包括以下步骤:s201对原始数据进行数据清洗;
s202进行特征数据类型转换,并对转换后的数据进行标准化处理,构建原始样本数据集。
9.本发明进一步设置为:在步骤s202中,所述原始样本数据集包括训练集和测试集,其训练集和测试集中样本数量比为4:1。
10.本发明进一步设置为:在步骤s3中,包括以下步骤:s301根据随机森林回归中二叉树节点包含的特征数和决策树的棵树构建随机森林回归模型;s302利用随机森林回归模型进行单特征重要性评估,对变量进行重要性度量的初步筛选;s303对初步筛选后得到的变量集进行特征剪除,获取最优特征变量集。
11.本发明进一步设置为:在步骤s302中,包括以下步骤:s3021将训练数据集作为随机森林回归模型的输入,对于随机森林回归模型中的每一棵决策树,采用该决策树对应的袋外数据计算其袋外数据误差;s3022随机对步骤s3021中的决策树对应的袋外数据中所有样本数据的某个特征x加入噪声干扰,然后再次计算该决策树对应的袋外数据误差;s3023构建重要性计算模型,并根据所述重要性计算模型对上述特征x进行特征重要性评价;s3024重复步骤s3021至步骤s3023,直至输出所述训练数据集中所有特征的特征重要性评价,并将所有特征的特征重要性评价按降序排列,并根据排序结果对特征进行重要性度量的初步筛选,在对所有变量的变量重要性评价按降序排序时,以模型精确度减小量为标准初步衡量各变量的重要性。
12.本发明进一步设置为:在步骤s3021中,所述袋外数据是指构建单棵决策树时,通过boostrap抽样得到的未参与该决策树建立过程的数据。
13.本发明进一步设置为:在步骤s3023中,所述重要性计算模型为:,式中,r1为随机森林回归模型中决策树对应的袋外数据的袋外误差,r2为对袋外数据中的某个特征x加入噪声干扰后的再次计算得到的袋外误差,n为随机森林回归模型中决策树的棵数。
14.本发明进一步设置为:在步骤s303中,对初步筛选后得到的变量集进行特征剪除,获取最优特征变量集,是指对初步筛选后得到的特征集,逐次去除一定比例的特征,每次去除一定比例的特征,对比除去该特征后,剩余变量对应的袋外误差率,将误差率最小的变量集作为最优特征变量集,并以此确定最优特征变量集中最优特征变量的数量,其中特征选择过程根据该重要性评价的结果对影响因素进行特征选择,选出随机森林回归模型误差最小的影响因素集合,并将该影响因素集合作为最优特征变量集。
15.本发明进一步设置为:在步骤s4中,包括以下步骤:s401基于最优特征变量结果,构建机器学习数据集,并划分为训练集、验证集和测试集;
s402构建多层bp神经网络模型,构建的多层bp神经网络模型包括输入层、三层隐含层和输出层,三层隐含层包括第一层隐含层、第二层隐含层、第三层隐含层,节点数依次为64,128,32,数据通过输入层进入神经网络,通过隐含层进一步处理传入输出层,输出所需结果;s403将训练集输入多层bp神经网络,对模型训练,获得输入和输出的映射关系;s404利用优化后的多层bp神经网络对测试集进行测试,获得输出结果,实现对混凝土工程量指标的预测。
16.本发明提供了一种基于机器学习的混凝土工程量指标估算方法。具备以下有益效果:本发明在工程成本指标估算方面应用机器学习技术,构建出一个基于以已建工程特征的量化数据为样本数据的数学模型,结合真实数据对模型进行训练,以实现混凝土工程量指标的预测与分析,本发明能够快速、高效、智能化的预测新项目的混凝土工程量,缩短含量指标计算时间,提高效率,减少不必要的重复性工作。
附图说明
17.图1为本发明的预测方法的流程图;图2为本发明的多层bp神经网络结构图;图3为本发明的混凝土工程量训练过程误差图;图4为本发明的混凝土工程量测试结果图;图5为本发明机器学习数据集样本数据构成表。
具体实施方式
18.为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。
19.如图1所示,一种基于机器学习的混凝土工程量指标估算方法,包括以下步骤:s1根据影响混凝土工程量指标的工程概况因素构建混凝土工程量指标估算体系,采集历史项目工程中各单体混凝土工程量指标估算体系的原始数据。
20.进一步的,混凝土工程量指标估算体系包括单体工程概况和混凝土工程量指标。
21.在本实施例中,单体工程概况包括:地上部分/地下部分、业态、地区、层高、地上层数/地下层数、抗震设防烈度、安全等级、户数每层、占地面积、总层高、檐高、结构类型、抗震等级、使用年限、地上建筑面积/地下建筑面积、总建筑面积、基础类型、是否有人防、人防面积占比、预制三板应用率、抗浮水位。
22.s2对提取到的原始数据进行多重数据处理,构建原始样本数据集,将原始样本集按指定比例划分为训练数据集和测试数据集。
23.进一步的,对提取到的原始数据进行多重数据处理,包括以下步骤:s201对原始数据进行数据清洗,主要包括删除空值、异常值删除。
24.s202进行特征数据类型转换,并对转换后的数据进行标准化处理,构建原始样本数据集。
25.更进一步的,原始样本数据集包括训练集和测试集,其训练集和测试集中样本数
量比为4:1。
26.s3构建随机森林回归模型,将训练数据集作为模型输入,对原始样本数据集进行特征选择。
27.进一步的,在步骤s3中,包括以下步骤:s301根据随机森林回归中二叉树节点包含的特征数和决策树的棵树构建随机森林回归模型。
28.s302利用随机森林回归模型进行单特征重要性评估,对变量进行重要性度量的初步筛选。
29.s303对初步筛选后得到的变量集进行特征剪除,获取最优特征变量集。
30.进一步的,在步骤s302中,包括以下步骤:s3021将训练数据集作为随机森林回归模型的输入,对于随机森林回归模型中的每一棵决策树,采用该决策树对应的袋外数据计算其袋外数据误差。
31.s3022随机对步骤s3021中的决策树对应的袋外数据中所有样本数据的某个特征x加入噪声干扰,然后再次计算该决策树对应的袋外数据误差。
32.s3023构建重要性计算模型,并根据所述重要性计算模型对上述特征x进行特征重要性评价。
33.s3024重复步骤s3021至步骤s3023,直至输出所述训练数据集中所有特征的特征重要性评价,并将所有特征的特征重要性评价按降序排列,并根据排序结果对特征进行重要性度量的初步筛选,在对所有变量的变量重要性评价按降序排序时,以模型精确度减小量为标准初步衡量各变量的重要性。
34.更进一步的,在步骤s3021中,袋外数据是指构建单棵决策树时,通过boostrap抽样得到的未参与该决策树建立过程的数据。
35.此外,在步骤s3023中,重要性计算模型为:,式中,r1为随机森林回归模型中决策树对应的袋外数据的袋外误差,r2为对袋外数据中的某个特征x加入噪声干扰后的再次计算得到的袋外误差,n为随机森林回归模型中决策树的棵数。
36.在步骤s303中,对初步筛选后得到的变量集进行特征剪除,获取最优特征变量集,是指对初步筛选后得到的特征集,逐次去除一定比例的特征,每次去除一定比例的特征,对比除去该特征后,剩余变量对应的袋外误差率,将误差率最小的变量集作为最优特征变量集,并以此确定最优特征变量集中最优特征变量的数量,其中特征选择过程根据该重要性评价的结果对影响因素进行特征选择,选出随机森林回归模型误差最小的影响因素集合,并将该影响因素集合作为最优特征变量集。
37.s4构建多层bp神经网络模型,将最优特征变量集作为多层bp神经网络模型的输入变量,对应混凝土工程量指标作为输出变量,对多层bp神经网络模型进行训练,并利用测试数据集对训练后的神经网络模型进行评估。
38.进一步的,在步骤s4中,包括以下步骤:s401基于最优特征变量结果,构建机器学习数据集,并划分为训练集、验证集和测
试集。
39.作为一种实施方式,机器学习数据集样本数据构成见表,如图5所示,表中输入因素包括地上/地下、业态、标准层高、抗震设防烈度、项目所在地区、耐火等级、总层高、结构类型、抗震等级、建筑面积以及基础类型,输出结果为混凝土工程量指标。
40.s402构建多层bp神经网络模型如图2所示,构建的多层bp神经网络模型包括输入层、三层隐含层和输出层,三层隐含层包括第一层隐含层、第二层隐含层、第三层隐含层,节点数依次为64,128,32,数据通过输入层进入神经网络,通过隐含层进一步处理传入输出层,输出所需结果。
41.s403将训练集输入多层bp神经网络,对模型训练,获得输入和输出的映射关系,训练过程误差图如图3所示。
42.s404利用优化后的多层bp神经网络对测试集进行测试,获得输出结果,实现对混凝土工程量指标的预测,测试结果如图4所示。
43.以上的仅是本发明的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献