一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于决策树的仓储模型决策优化方法

2022-06-25 12:06:18 来源:中国专利 TAG:


1.本技术属于数据挖掘技术领域,具体涉及一种基于决策树的仓储模型决策优化方法。


背景技术:

2.库存,是仓库中实际储存的货物。可以分两类:一类是生产库存,即直接消耗物资的基层企业、事业的库存物资,它是为了保证企业、事业单位所消耗的物资能够不间断地供应而储存的;另一类是流通库存,即生产企业的原材料或成品库存,生产主管部门的库存和各级物资主管部门的库存。此外,还有特殊形式的国家储备物资,它们主要是为了保证及时、齐备地将物资供应或销售给基层企业、事业单位的供销库存。
3.因此,库存相当于物流企业的中流砥柱,企业中大约40%的资金被库存所占用,然而目前的库存决策主要是根据人工进行主观的决策。对于人工主观决策而言,对决策人或团队的专业性要求高,使得企业的库存决策成本上升,并且在面对库存量较大的决策时,所耗费的时间长,实时性差。
4.随着社会经济的发展,物流流程越来越复杂并且存在很多问题不可预测,这使得人工进行主观决策的难度越来越高。因此在数据挖掘技术支持的背景下,运用决策树算法,为物流企业提供库存的决策和优化对于企业来说有至关重要的意义。


技术实现要素:

5.本技术的目的在于提供一种基于决策树的仓储模型决策优化方法,决策耗时短,实时性高,且决策方案可靠。
6.为实现上述目的,本技术所采取的技术方案为:
7.一种基于决策树的仓储模型决策优化方法,所述基于决策树的仓储模型决策优化方法包括:
8.步骤s1、采集原始数据,对所述原始数据预处理后作为决策树的训练集;
9.步骤s2、根据所述训练集统计库存决策模型的各个属性,计算各个属性的信息增益率,所述库存决策模型的属性包括短缺成本属性、存储成本属性、补货时间属性,所述仓储模型作为类别属性;
10.步骤s3、根据库存决策模型各个属性的信息增益率,采用c4.5算法构建决策树,所述决策树作为库存决策模型;
11.步骤s4、基于所述决策树得到分类规则,分析短缺成本属性、存储成本属性、补货时间属性与仓储模型之间的相关性,并基于该分类规则进行库存仓储决策得到最优的仓储模型。
12.以下还提供了若干可选方式,但并不作为对上述总体方案的额外限定,仅仅是进一步的增补或优选,在没有技术或逻辑矛盾的前提下,各可选方式可单独针对上述总体方案进行组合,还可以是多个可选方式之间进行组合。
13.作为优选,所述计算各个属性的信息增益率,包括:
14.以训练集作为样本d,设样本d有n种不同分类类别的连续性属性,则样本d的类别属性的信息熵计算公式如公式(1)所示:
[0015][0016]
公式(1)中,pk代表第k种分类类别属性占样本d的比例;
[0017]
根据fayyard边界点原理,选择属性a为测试属性,属性a在样本d上有n个不同取值,将n个不同取值按从小到大排序,记为{a1,a2,...,an},选取排序后属性a相邻两类n1、n2边界点处的6个属性取值a
i-2
,a
i-1
,ai,a
i 1
,a
i 2
,a
i 3
且a
i-2
《a
i-1
《ai《a
i 1
《a
i 2
《a
i 3
,其中,ai是类别n1中属性a的最大值,a
i 1
是类别n2中属性a的最小值;
[0018]
对于样本d,测试属性a的信息熵ha(d)计算公式如公式(2)所示:
[0019][0020]
公式(2)中为测试属性a中第v个取值占样本d的比例;
[0021]
样本d的类别属性的信息熵与在测试属性a条件下样本d的信息熵之差为gain(d,a),即计算测试属性a对于样本d的信息增益gain(d,a)如公式(3)所示:
[0022][0023]
则测试属性a的信息增益率gain_ration(d,a)计算公式如公式(4)所示:
[0024][0025]
通过计算各个属性的信息增益率,把信息增益率最大的属性作为分裂属性。
[0026]
作为优选,所述仓储模型包括定量订货模型、定期订货模型、允许缺货且生产时间短模型、允许缺货且交货时间或生产时间具有预设长度的模型,计算各个属性的信息增益率时,将仓储模型中的定量订货模型、定期订货模型、允许缺货且生产时间短模型、允许缺货且交货时间或生产时间具有预设长度的模型的值作为类别属性的值;
[0027]
其中,定量订货模型的计算公式如公式(5)所示:
[0028][0029]
式中c(t)代表t时间内仓储的平均总费用,r为需求速度,c1代表单位存储费,c3代表每次订购费,k代表货物单价;
[0030]
其中,定期订货模型的计算公式如公式(6)所示:
[0031][0032]
式中p表示生产速度;
[0033]
其中,允许缺货且生产时间短模型的计算公式如公式(7)所示:
[0034][0035]
式中c(t,s)代表在最初存储量为s情况下t时间内仓储的平均总费用,c2代表单位缺货费;
[0036]
其中,允许缺货且交货时间或生产时间具有预设长度模型的计算公式如公式(8)所示:
[0037][0038]
式中t1代表允许缺货时间。
[0039]
作为优选,所述步骤s3中根据各个属性的信息增益率,采用c4.5算法构建决策树,包括:
[0040]
将所述分裂属性作为根节点,通过根节点将样本d分为两个子样本d1和d2,在样本d1和d2中分别通过公式(2)~(4)计算每个属性的信息增益率,然后通过递归的方法一直分裂到子样本为纯样本,完成决策树的构建。
[0041]
作为优选,所述基于该分类规则进行库存仓储决策,包括:
[0042]
获取待决策的原始数据,将原始数据转化为若干条输入数据,每条输入数据包括短缺成本属性值、存储成本属性值、补货时间属性值,将输入数据作为决策树的输入,决策树针对每条输入数据输出对应的仓储模型。
[0043]
本技术提供的基于决策树的仓储模型决策优化方法,利用决策树构建库存决策模型,基于建立的分类规则即可根据属性输出对应的库存仓储模型,决策耗时短,实时性高;并且科学构建建库存决策模型,综合考虑各个属性与库存仓储模型各类别属性的相关性,分析仓库库存成本时间因素对于仓储模型决策的影响,提高决策的可靠性,方便的为物流企业管理者提供正确的库存仓储决策方案。
附图说明
[0044]
图1为本技术的实施例1中基于决策树的仓储模型决策优化方法的流程图;
[0045]
图2为本技术的实施例2中基于决策树的仓储模型决策优化方法的流程图。
具体实施方式
[0046]
下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0047]
除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是在于限制本技术。
[0048]
实施例1:如图1所示,本实施例提供一种基于决策树的仓储模型决策优化方法,用于为物流企业管理者提供正确的库存仓储决策方案。
[0049]
本实施例的基于决策树的仓储模型决策优化方法,包括以下步骤:
[0050]
步骤s1、采集原始数据,对原始数据预处理后作为决策树的训练集。
[0051]
原始数据是基于企业现有的运营系统中的物流数据、财务数据、交易数据以及其他相关数据采集得到,例如交易时间、运输时间、运输地点等,所获取的仓储模型包括基于货物维度、客户维度、时间维度以及库存、入库和出库事实,从相关的数据表中取出数据,例如库存数量、入库时间、出库时间等。
[0052]
对原始数据进行预处理,包括对信息数据中不符合或者缺失数据进行清洗和转换,本实施例通过etl工具将原始数据进行数据的清理、变换、归约等操作,去除数据的噪声、不完整性和不一致性。
[0053]
步骤s2、根据训练集中统计的库存决策模型的各个属性,计算各个属性的信息增益率。
[0054]
本实施例首先确定库存决策模型的属性包括短缺成本属性、存储成本属性、补货时间属性,即根据这几种属性进行库存决策。
[0055]
数据处理后得到的训练集中包含多个仓储模型对应的数据,通过etl工具将训练集中的数据转换为库存决策模型的各个属性,完成数据统计。
[0056]
在计算库存决策模型各个属性的信息增益率时,以训练集作为样本d,设样本d有n种不同分类类别的连续性属性,则样本d的类别属性的信息熵计算公式如公式(1)所示:
[0057][0058]
公式(1)中,pk代表第k种分类类别属性占样本d的比例。
[0059]
根据fayyard边界点原理(无论用于学习的数据集有多少个类别,不管类别的分布如何,连续性属性的最佳分割点总在边界处),选择属性a为测试属性,属性a在样本d上有n个不同取值,将n个不同取值按从小到大排序,记为{a1,a2,...,an},选取排序后属性a相邻两类n1、n2边界点处的6个属性取值a
i-2
,a
i-1
,ai,a
i 1
,a
i 2
,a
i 3
且a
i-2
《a
i-1
《ai《a
i 1
《a
i 2
《a
i 3
,其中,ai是类别n1中属性a的最大值,a
i 1
是类别n2中属性a的最小值。
[0060]
对于样本d,测试属性a的信息熵ha(d)计算公式如公式(2)所示:
[0061][0062]
公式(2)中为测试属性a中第v个取值占样本d的比例;
[0063]
样本d的类别属性的信息熵与在测试属性a条件下样本d的信息熵之差为gain(d,a),即计算测试属性a对于样本d的信息增益gain(d,a)如公式(3)所示:
[0064][0065]
则测试属性a的信息增益率gain_ration(d,a)计算公式如公式(4)所示:
[0066]
[0067]
通过计算各个属性的信息增益率,把信息增益率最大的属性作为分裂属性。
[0068]
由于本实施例的仓储模型包括定量订货模型、定期订货模型、允许缺货且生产时间短模型、允许缺货且交货时间或生产时间具有预设长度的模型。因此计算各个属性的信息增益率时,将仓储模型中的定量订货模型、定期订货模型、允许缺货且生产时间短模型、允许缺货且交货时间或生产时间具有预设长度的模型的值作为仓储模型的值。
[0069]
其中,定量订货模型的计算公式如公式(5)所示:
[0070][0071]
式中c(t)代表t时间内仓储的平均总费用,r为需求速度,c1代表单位存储费,c3代表每次订购费,k代表货物单价;
[0072]
其中,定期订货模型的计算公式如公式(6)所示:
[0073][0074]
式中p表示生产速度;
[0075]
其中,允许缺货且生产时间短模型的计算公式如公式(7)所示:
[0076][0077]
式中c(t,s)代表在最初存储量为s情况下t时间内仓储的平均总费用,c2代表单位缺货费;
[0078]
其中,允许缺货且交货时间或生产时间具有预设长度模型的计算公式如公式(8)所示:
[0079][0080]
式中t1代表允许缺货时间。
[0081]
本实施例在上述定量订货模型和定期订货模型中的平均总费用均采用c(t)表示,允许缺货且生产时间短模型和允许缺货且交货时间或生产时间具有预设长度模型的平均总费用均采用c(t,s),在其他实施例中也可以增加区分标识符进行区分表示。
[0082]
步骤s3、根据库存决策模型各个属性的信息增益率,采用c4.5算法构建决策树,将决策树作为库存决策模型,包括:
[0083]
将分裂属性作为根节点,通过根节点将样本d分为两个子样本d1和d2,在样本d1和d2中分别通过公式(2)~(4)计算每个属性的信息增益率,然后通过递归的方法一直分裂到子样本为纯样本,完成决策树的构建。
[0084]
步骤s4、基于所述决策树得到分类规则,分析短缺成本属性、存储成本属性、补货时间属性与库存仓储模型之间的相关性,并基于该分类规则进行库存仓储决策得到最优的仓储模型。
[0085]
根据决策树的构建过程可知,本技术基于该分类规则进行库存仓储决策的具体过程为:获取待决策的原始数据,将原始数据转化为若干条输入数据,每条输入数据包括短缺成本属性值、存储成本属性值、补货时间属性值,将输入数据作为决策树的输入,决策树针
对每条输入数据输出对应的仓储模型。本实施例中的仓储模型即为仓储决策结果,为具体的仓储方案。
[0086]
得到分类规则以后即可根据不同的输入数据输出对应的结果,进行库存仓储决策,得到仓储模型,并且该决策树还可依据新的数据重新进行优化训练,以保持具有良好的分类效果,为企业的库存决策提供有利帮助。
[0087]
实施例2:如图2所示,一种基于决策树的仓储模型决策优化方法,所述方法的具体步骤如下:
[0088]
1)采集不同数据来源的原始数据。具体地:
[0089]
从原始物流信息系统中,基于货物维度、客户维度、时间维度以及库存、入库和出库事实,从相关的数据表中取出数据,这些数据为每个仓储模型所包含的数据。
[0090]
2)对数据进行清洗、转换的预先处理,成为库存决策模型数据,同时作为决策树的训练集,并标记为样本d,具体地:
[0091]
通过etl工具将原始数据进行数据的清理、变换、归约等操作,去除数据的噪声、不完整性和不一致性,将原始数据转换为库存决策模型的各个属性:短缺成本属性、存储成本属性、补货时间属性。
[0092]
原始数据中仓储模型来自业务操作系统中大量的历史数据中成功案例的模型,包含定量订货模型、定期订货模型、允许缺货且生产时间短模型、允许缺货且交货时间和生产时间具有预设长度的模型。
[0093]
3)计算库存决策模型各属性的信息增益率。具体地:
[0094]
将仓储模型类别作为类别属性,将定量订货模型、定期订货模型、允许缺货且生产时间短模型、允许缺货且交货时间或生产时间具有预设长度的模型作为类别属性的值。将库存决策模型的短缺成本属性、存储成本属性、补货时间属性以及类别属性仓储模型依次其标记为c1、c2、c3、c4。
[0095]
计算样本d中,类别属性c4的信息熵,计算公式如下所示:
[0096]
ent(d)=-p
k1
log2p
k1-p
k2
log2p
k2-p
k3
log2p
k3-p
k4
log2p
k4
[0097]
属性短缺成本c1在样本d上有n个不同取值,将这些值按从小到大排序,记为{a1,a2,...,an},选取排序后属性a相邻两类n1,n2边界点处的6个属性取值a
i-2
,a
i-1
,ai,a
i 1
,a
i 2
,a
i 3
且a
i-2
《a
i-1
《ai《a
i 1
《a
i 2
《a
i 3
。其中,ai是类别n1中属性a的最大值,a
i 1
是类别n2中属性a的最小值。计算这6个属性值的信息增益率,选择信息增益率最大的划分点为属性a的划分点,计算公式如公式下所示:
[0098][0099][0100][0101]
通过比较c1、c2、c3的信息增益率发现c1的信息增益率最高,所以将属性c1作为根属性(根节点t),即分裂属性。
[0102]
4)采用改进的c4.5算法构建库存决策的分析模型,生成决策树。具体地:
[0103]
在生成以属性c1作为根属性后,将样本d分为两个子样本d1和d2,再通过递归的方法计算d1和d2中每个属性的信息增益率,分别取d1和d2中信息增益率最大的叶节点作为新的分支节点,直到子样本为纯样本,即生成库存决策分析决策树。
[0104]
5)通过生成的决策树,可以获得短缺成本、存储成本、补货时间与库存仓储模型之间的相关性,进而为库存决策方案的选择,即仓储模型的选择提供可靠的依据。具体地:
[0105]
从现有物流系统中原始数据中取出最新一部分的数据按照步骤2)中转换为短缺成本、存储成本、补货时间对应的数据作为决策树的输入集,通过决策树模型的运算,即可得出每一条短缺成本、存储成本、补货时间三个属性对应的仓储模型。
[0106]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0107]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献