基于改进决策树的压路机施工工艺知识库构建方法及系统与流程

2022-02-21 04:24:03 来源：中国专利 TAG：

1.本发明属于压路机施工技术领域，具体涉及基于改进决策树的压路机施工工艺知识库构建方法及系统。

背景技术：

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。
3.近年来随着大数据时代的降临，土建工程行业迎来了新的机遇和挑战。传统的施工决策方式流程繁琐，耗费了人力物力。科研工作者开始尝试采用新技术来简化决策过程，以达到准确快速地确定工艺流程的目的。
4.土建行业确定压路机施工流程的各项工艺及参数的传统方式流程繁琐，并且较为依赖工程师的经验，主观性较强。每一个参数的确定都要查阅相关资料，进而由工程师统筹决定，并不利于具体施工的开展，容易延误工期或造车错误施工。
5.目前虽然有部分研究学者通过决策树利用数据生成决策，但决策树对于非正态数据的处理有自身的局限性，易陷入局部最优，而压路机施工流程数据很难保证全为正态分布，存在很大的局限性。

技术实现要素：

6.本发明为了解决上述问题，提出基于改进决策树的压路机施工工艺知识库构建方法及系统，本发明能够保证压路机施工流程数据能够保证全为正态分布，解决现有决策树的局限性，能够辅助工程师进行压路机施工的决策。
7.根据一些实施例，本发明采用如下技术方案：
8.一种基于改进决策树的压路机施工工艺知识库构建方法，包括以下步骤：
9.根据压路机施工项目已有案例数据，构建压路机施工工艺数据库；
10.判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布，如果是则保持现有数据不变，否则对非正态分布数据进行box—cox转换，将其转换为正态分布数据；
11.计算各个判断属性的基尼系统并按序排列，初步形成决策树；
12.对决策树中经过box—cox转换的数据进行相关逆变换；
13.对逆变换后的决策树进行剪枝优化处理，保证最小实例数大于设定值，形成改进后的决策树模型；
14.获取压路机施工对象及施工要求相关参数；
15.根据施工对象及施工要求相关参数，利用改进后的决策树模型进行分类分析，得到压路机施工方案，形成压路机施工工艺知识库。
16.作为可选择的实施方式，所述压路机施工对象包括土壤类型，施工对象的底长、底宽、深度及放坡系数。
17.作为可选择的实施方式，所述压路机施工要求相关参数包括施工要求属性、压路机型号以及初压、复压、终压三个阶段的压路机振幅、频率、碾压速度和碾压遍数，施工要求属性包括压实度、平整度和均匀度。
18.作为可选择的实施方式，施工对象、施工要求两大类属性作为决策树模型中的判断属性，不同的判断属性组成决策树的根节点及内部节点，判断属性所划分等级为决策树各个分叉；
19.压路机型号以及初压、复压、终压三个阶段的压路机关键参数作为决策树的决策结果，决策树经各个分叉到达的各个叶节点分别代表一种压路机施工方案，每个施工方案对应决策树的一个叶节点。
20.作为可选择的实施方式，判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布的具体过程包括：采用anderson-darling正态性检验判断分布类型，对样本数据x进行升序排列，采用离散表达式计算经验分布函数与指定分布函数的距离参数，若所述距离参数小于设定的检验临界值，则认为相应变量的分布函数符合正态分布，反之不符合正态分布。
21.作为可选择的实施方式，对非正态分布数据进行box—cox转换的具体过程包括：利用box—cox的幂函数转换方法，将非正态分布数据转换为正态分布数据，对非正态分布随机变量x，有变换公式：
[0022][0023]
其中λ的取值由极大似然估计确定。
[0024]
作为可选择的实施方式，计算各个判断属性的基尼系统并按序排列，初步形成决策树的具体过程包括：以施工对象及施工要求相关参数每个属性为一个判断属性，基尼系数计算公式为：
[0025][0026]
其中gini(x)表示判断属性x某一等级的基尼系数，该等级中共有n个不同案例，p(xk)表示第k个案例在所有等级样本中的频率，依此计算判断属性x中所有等级的基尼系数，并对所有等级的基尼系数按照其样本数进行加权平均，得到该判断属性x的基尼系数；
[0027]
将其升序排列，基尼系数最高的属性作为最初的根节点，该属性的分级作为根节点延伸出的分叉；
[0028]
在每个分叉对应的子知识库分别计算剩余属性的基尼系数，基尼系数最低的属性作为根节点分叉后的第一个内部节点，逐步计算，构建决策树过程中按照基尼系数由低至高向下延伸。
[0029]
作为进一步的限定，若某案例中缺少若干判断属性，则将此案例作为残缺数据进行舍去。
[0030]
作为可选择的实施方式，所述施工方案中包括压路机型号以及初压、复压、终压三个阶段的压路机关键参数。
[0031]
一种基于改进决策树的压路机施工工艺知识库构建系统，包括：
[0032]
数据库构建模块，被配置为根据压路机施工项目已有案例数据，构建压路机施工工艺数据库；
[0033]
数据转换模块，被配置为判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布，如果是则保持现有数据不变，否则对非正态分布数据进行box—cox转换，将其转换为正态分布数据；
[0034]
决策树模型构建模块，被配置为计算各个判断属性的基尼系统并按序排列，初步形成决策树；
[0035]
数据逆变换模块，被配置为对决策树中经过box—cox转换的数据进行相关逆变换；
[0036]
决策树模型优化模块，被配置为对逆变换后的决策树进行剪枝优化处理，保证最小实例数大于设定值，形成最终改进后的决策树模型；
[0037]
参数获取模块，被配置为获取压路机施工对象及施工要求相关参数；
[0038]
分类分析模块，被配置为根据施工对象及施工要求相关参数，利用改进后的决策树模型进行分类分析，得到压路机施工方案，形成压路机施工工艺知识库。
[0039]
一种计算机可读存储介质，其中存储有多条指令，所述指令适于由终端设备的处理器加载并执行上述方法的步骤。
[0040]
一种终端设备，包括处理器和计算机可读存储介质，处理器用于实现各指令；计算机可读存储介质用于存储多条指令，所述指令适于由处理器加载并执行上述方法的步骤。
[0041]
与现有技术相比，本发明的有益效果为：
[0042]
本发明可以根据历史案例数据，从中剖析数据隐含的信息和规律，并对这种暗含规律进行处理利用，减少了工程师的经验参与程度，提高决策流程的合理性和智能性，实现压路机的智能一体化施工，同时，通过对非正态数据进行转换，能够保证压路机施工流程数据能够保证全为正态分布，解决现有决策树的局限性，能够辅助工程师进行压路机施工的决策，形成最终的建议建议施工方案，还可以形成压路机施工工艺知识库，指导实际施工。
[0043]
为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。
附图说明
[0044]
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。
[0045]
图1为本发明至少一个实施例的流程示意图。
具体实施方式：
[0046]
下面结合附图与实施例对本发明作进一步说明。
[0047]
应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
[0048]
需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式
也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0049]
一种基于改进决策树的压路机施工工艺知识库构建方法，针对压路机施工的大数据分析领域，采用anderson-darling正态性检验判断数据库中的各项数据是否为正态分布，若非正态分布，则将数据库中的案例数据中的非正态分布经过box—cox转换为正态分布数据。进行基尼系数的计算及排序，形成cart决策树，经由box—cox逆变换及剪枝处理形成一个压路机施工工艺知识库，指导实际施工，给出建议施工方案。
[0050]
如图1所示，以一种典型实施例，介绍方法的具体步骤：
[0051]
构建压路机施工案例数据库，数据库包含数年积累的海量压路机施工工艺数据，数据库中的案例主要包括施工对象、施工要求、压路机型号、以及初压、复压、终压三个阶段的压路机关键参数。施工对象属性包括土壤类型，施工对象的底长、底宽、深度及放坡系数。其中土壤类型依照土壤分类表分为一类土、二类土、三类土及四类土，施工对象的底长、底宽、深度及放坡系数也分别划分三个等级。施工要求属性包括压实度、平整度、均匀度三个属性，将此三个属性各自分为三个等级。初压、复压、终压三个阶段的压路机关键参数包括三个阶段的振幅、频率、碾压速度及碾压遍数，以上参数各自划分三个等级。
[0052]
其中施工对象、施工要求两大类属性作为决策树中的判断属性，不同的判断属性组成了决策树的根节点及内部节点，判断属性所划分等级为决策树各个分叉。压路机型号以及初压、复压、终压三个阶段的压路机关键参数作为决策树的决策结果，决策树经各个分叉到达的各个叶节点分别代表一种压路机施工方案，每个施工方案对应决策树的一个叶节点。
[0053]
判断施工对象和施工要求的各项数据是否为正态分布，如果不是正态分布，生成决策树容易陷入局部最优。采用anderson-darling正态性检验判断分布类型，对样本数据x进行升序排列，采用a2代表经验分布函数与指定分布函数的距离参数，本实施例采用离散表达式计算a2，公式如下：
[0054][0055]
式中，n代表样本数目，yi是排序数据，f(yi)是指定分布(这里为标准正态分布)的累积概率分布函数。
[0056]
现有假设：假设h0：x变量的分布函数符合指定分布；
[0057]
假设h1：x变量的分布函数不符合指定分布。
[0058]
在指定显著性水平下，若参数a2小于检验临界值，则接受假设h0，认为x变量的分布函数符合指定分布，即符合正态分布，反之不符合正态分布。
[0059]
根据样本数量n对a2进行修正，得到检验统计量a
*
，公式如下：
[0060][0061]
如果a
*
超过0.77则拒绝正态性假设，认为非正态分布，反之认为正态分布。因数据量庞大，判断为正态分布采用更宽容的判断标准，检验临界值0.77是一个相对较大的临界值。
[0062]
若判断为正态分布数据，则保持不变；若判断为非正态分布数据，为避免决策树陷
入局部最优，则利用box—cox的幂函数转换方法，将非正态分布数据转换为正态分布数据。对非正态分布随机变量x，有变换公式：
[0063][0064]
其中λ的取值由极大似然估计确定，通过确定合适的λ的取值使y
(λ)
服从正态分布，即y
(λ)
～n(μ,σ2)。则随机变量x的似然函数为：
[0065][0066]
为方便计算将似然函数取对数，对数似然函数为：
[0067][0068]
经对数似然函数转换后，确定均值的估计值：
[0069][0070]
经对数似然函数转换后，确定标准差的估计值：
[0071][0072]
将最大似然估计的μ和σ代入似然函数中，可以将λ计算出来。将计算的一系列λ进行正态分布数据的变换，对转换后的数据绘制概率图进行检验，选择概率图中p值最小的λ，完成box—cox转换。
[0073]
压路机施工工艺流程的决策树构建过程如下：计算土壤类型、施工对象的底长、施工对象的底宽、施工对象的深度、施工对象的放坡系数、施工要求的压实度、施工要求的平整度、施工要求的均匀度等共计8个判断属性的基尼系数，基尼系数越低代表纯度越高、数据分类的效果越好，此时8个判断属性中的非正态分布数据已经经过box—cox转换为正态分布数据，即所有判断属性此时都是正态分布数据，基尼系数计算公式为：
[0074][0075]
其中gini(x)表示判断属性x某一等级的基尼系数，该等级中共有n个不同案例，p(xk)表示第k个案例在所有等级样本中的频率。依此计算判断属性x中所有等级的基尼系数，并对所有等级的基尼系数按照其样本数进行加权平均，得到该判断属性x的基尼系数。
[0076]
计算基尼系数前应对残缺数据进行缺省值处理，如果某条案例缺少8个判断属性的数据，或者缺少压路机型号的数据，应将本条案例舍去。缺省值处理完成后，计算各属性基尼系数，将其升序排列，基尼系数最高的属性作为最初的根节点，该属性的分级作为根节点延伸出的分叉。根节点判断完成，已经对知识库完成了一次分类。基于这次分类的结果，在每个分叉对应的子知识库分别计算剩余7个属性的基尼系数，基尼系数最低的属性作为根节点分叉后的第一个内部节点。以此类推，逐步计算，构建决策树过程中按照基尼系数由
低至高向下延伸。
[0077]
初步生成的决策树判断中的数据进行了box—cox变换，为方便使用决策树，对已经进行了box—cox变换的数据进行box—cox的逆变换，将正态分布数据重新转换为非正态数据，公式如下：
[0078][0079]
式中，x为非正态分布数据，y
(λ)
为正态分布数据，λ由极大似然估计确定。
[0080]
box—cox逆变换后对策树后进行后剪枝处理。最小实例数要求每个叶子的实例数应大于等于2，最小实例数小于2的叶子应舍去。由此完成对决策树的结果优化，提升了决策树的决策可信度。
[0081]
生成决策树后，输入压路机施工对象及施工要求各项参数，经决策树进行分类分析，得到相应压路机施工方案，确定压路机型号以及初压、复压、终压三个阶段的压路机关键参数，指导实际施工。
[0082]
当然，各个施工方案可以形成压路机施工工艺知识库，后期加以利用。
[0083]
本部分还提供以下产品实施例：
[0084]
一种基于改进决策树的压路机施工系统，包括：
[0085]
数据库构建模块，被配置为根据压路机施工项目已有案例数据，构建压路机施工工艺数据库；
[0086]
数据转换模块，被配置为判断压路机施工工艺数据中的施工对象和施工要求的各项数据是否为正态分布，如果是则保持现有数据不变，否则对非正态分布数据进行box—cox转换，将其转换为正态分布数据；
[0087]
决策树模型构建模块，被配置为计算各个判断属性的基尼系统并按序排列，初步形成决策树；
[0088]
数据逆变换模块，被配置为对决策树中经过box—cox转换的数据进行相关逆变换；
[0089]
决策树模型优化模块，被配置为对逆变换后的决策树进行剪枝优化处理，保证最小实例数大于设定值，形成最终改进后的决策树模型；
[0090]
参数获取模块，被配置为获取压路机施工对象及施工要求相关参数；
[0091]
分类分析模块，被配置为根据施工对象及施工要求相关参数，利用改进后的决策树模型进行分类分析，得到压路机施工方案。
[0092]
一种计算机可读存储介质，其中存储有多条指令，所述指令适于由终端设备的处理器加载并执行上述方法的步骤。
[0093]
一种终端设备，包括处理器和计算机可读存储介质，处理器用于实现各指令；计算机可读存储介质用于存储多条指令，所述指令适于由处理器加载并执行上述方法的步骤。
[0094]
本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产
品的形式。
[0095]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0096]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0097]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0098]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
[0099]
上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于置信散度的冲突证据合成方法与流程

基于改进决策树的压路机施工工艺知识库构建方法及系统与流程

相关文献

最热文献