一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

散粮集装箱物流运输过程的级联多类异常识别方法与流程

2021-11-03 20:55:00 来源:中国专利 TAG:


1.本发明涉及物流运输异常识别技术领域,主要涉及一种散粮集装箱物流运输过程的级联多类异常识别方法。


背景技术:

2.集装箱多式联运综合水路、铁路和公路等多种运输方式,实现各种运输方式间的无缝衔接,提高了运输效率,降低了运输成本。同时集装箱物流对货物包装要求低、安全系数较高,大幅度减少货损。散粮从存储到销售,每一个环节的主体都以自己的身份(私钥)将信息签名写入溯源信息,信息不可篡改,身份不可抵赖。当集装箱在运输的过程状态发生变化时,集装箱的时间和地点及周围的环境信息可以上载到托运人或管理人员的管理系统中,以实时跟踪集装箱。异常出现时,可以很快的定位出问题的环节,从而进行举证和追责。
3.根据散粮集装箱运输在途状态监测的任务不同,集装箱物流异常至少有以下几种:(1)运输路线异常:是指集装箱运输的实际路线可能会偏离计划的路径,甚至不能按时到达或离开节点位置。(2)箱体完整性异常:由于集装箱物流的运输路线过长和管理不严等,集装箱受到外部冲击导致的箱门破损、箱门未经授权非法打开甚至箱体本身破损。(3)环境异常:包括箱内环境和箱外环境。箱内环境是指散粮所处的大气环境,应保证箱内环境在货物要求的范围内。箱外环境是指集装箱所处当地位置的大气环境。(4)运行状态异常。集装箱的运行状态是指集装箱物流途中的速度、倾角等状态,是保证物流时效的最重要条件。
4.散粮集装箱在多式联运过程中,集装箱物流的状态在大部分时间中应该是正常的,即采集到的散粮集装箱物流状态数据样本多数是正常状态的数据,少部分是异常状态的数据。其中具体到某一种异常状态的数据就更少了。识别散粮集装箱物流运输过程的异常状态在机器学习领域可以看作是一种多类分类问题,更可以看作是一种基于不平衡数据的多类分类问题。支持向量机(svm)是在所有知名的数据挖掘算法中最健壮,最准确的方法之一,它属于二分类算法。
5.构造svm多类分类器的方法主要有两类:
6.(1)直接法,直接在目标函数上进行修改,将多个分类面的参数求解合并到一个最优化问题中,通过求解该最优化问题“一次性”实现多类分类。这种方法看似简单,但其计算复杂度比较高,实现起来比较困难,只适合用于小型问题中。
7.(2)间接法,主要是通过组合多个二分类器来实现多分类器的构造,常见的方法有one

against

one和one

against

all两种。当类别较多的时候计算代价会显著提高。在不平衡数据处理方法,典型的样本平衡预处理方法有数据重采样法和代价敏感法。这些方法通过增加或降低样本的数据让多个类别的样本数达到评审,容易使样本偏离原有的分布。
8.事实上,对于采集到的散粮集装箱物流运输过程的样本数据,值得关心的是少量的异常数据,而不是大量的正常状态的数据。这种需求使得我们需要设计一种独特的识别模型,能够高效地对运输过程的异常数据进行快速识别。。


技术实现要素:

9.发明目的:针对上述背景技术中提出的问题,本发明提供了一种散粮集装箱物流运输过程的级联多类异常识别技术,通过级联多类异常识别技术将不平衡数据多类分类问题转化为平衡的数据多类分类问题,避免样本不平衡特性会导致特征选择算法更倾向于选择能够更好区分大类样本的特征集。
10.技术方案:为实现上述目的,本发明采用的技术方案为:
11.一种散粮集装箱物流运输过程的级联多类异常识别方法,包括以下步骤:
12.步骤s1、采集散粮集装箱物流运输过程的数据样本集,包括训练样本集步骤s1、采集散粮集装箱物流运输过程的数据样本集,包括训练样本集和验证样本集所述训练样本集x包括n条样本,验证样本集v包括m条样本,每条样本包括d个特征;t
i
∈{

1,1,2,

,c},表示样本类别;样本类别包括1个正常类别的样本和c个异常类别的样本,其中t
i


1表示散粮集装箱物流运输过程处于正常状态,t
i
为1到c则表示该样本处于异常状态。
13.步骤s2、将训练样本集x中类别为{1,2,

,c}的所有样本合并到类别1的样本集合中,构建一级识别所需训练样本集x1;使用样本集x1训练二类分类模型bi

kelm

train,得到模型最优解α
*1

14.步骤s3、将训练样本集x中类别为

1的样本去除,构建二级识别所需训练样本集x2;使用样本集x2训练多类分类模型multi

kelm

train,得到模型最优解α
*2

15.步骤s4、将验证样本集v中类别为{1,2,

,c}的所有样本合并到类别1的样本集合中,构建一级异常验证样本集v1;通过二类分类模型bi

kelm

train对样本集v1进行验证;当预测结果为正常样本时,输出结果为

1;当预测结果为其他类别时,进一步构建二级异常验证样本v2,进行二次验证;
16.步骤s5、将验证样本集v中类别为

1的样本去除,构建二级异常验证样本v2,采用步骤s3中所述多类分类模型multi

kelm

train对样本集v2进行二级预测,得到散粮集装箱物流的具体异常类别。
17.进一步地,所述步骤s2中使用样本集x1训练二类分类模型bi

kelm

train,具体步骤包括:
18.步骤s2.1、选取最小二乘超限学习机kelm模型参数,包括隐节点个数l1和惩罚因子c1;
19.步骤s2.2、随机赋值输入权值a和隐藏层偏置b,其中a∈r
n
×
l1
,b∈r
l1

20.步骤s2.3、选取激活函数g(a,b,x),g(
·
)其中非线性分段连续函数,x为样本集x1中的样本;
21.步骤s2.4、构建隐藏层输出矩阵h:
[0022][0023]
步骤s2.5、计算超限学习机核矩阵k
elm

[0024]
k
elm
=hh
t
[0025]
步骤s2.6、计算模型最优解其中i为n
×
n的单位矩阵,t=[t1,

,t
n
]
t
,t
i
∈{

1,1},i=1,

,n。
[0026]
进一步地,步骤s4中通过二类分类模型bi

kelm

train对样本集v1进行验证的具体方法如下:
[0027][0028]
当时,f(x)=1,表示预测x的类别为1;
[0029]
当时,f(x)=

1,表示预测x的类别为

1。
[0030]
进一步地,所述步骤s2.1中惩罚因子c1的取值为集合{2
‑9,2
‑8,

,20,

,2
14
,2
15
},隐节点个数l1的取值为1000。
[0031]
进一步地,所述步骤s3中使用样本集x2训练多类分类模型multi

kelm

train具体步骤包括:
[0032]
步骤s3.1、选取最小二乘超限学习机kelm模型参数,包括隐节点个数l2和惩罚因子c2;
[0033]
步骤s3.2、随机赋值输入权值a和隐藏层偏置b,其中a∈r
n
×
l2
,b∈r
l2

[0034]
步骤s3.3、选取激活函数g(a,b,x),g(
·
)其中非线性分段连续函数,x为样本集x2中的样本;
[0035]
步骤s3.4、构建隐藏层输出矩阵h:
[0036][0037]
步骤s3.5、计算超限学习机核矩阵k
elm

[0038]
k
elm
=hh
t
[0039]
步骤s3.6、计算最优解其中i为n
×
n的单位矩阵,t=[t1,

,t
c
]
t
,t
i
=[t
i1
,t
i2


,t
ic
],当样本x
i
对应的类别为k时,t
i1
=1,其余的元素为0。
[0040]
进一步地,步骤s5中用多类分类模型multi

kelm

train对样本集v2进行二级预测的具体方法如下:
[0041][0042]
其中f(x)=[f1(x),


f
c(x)]
t
,x的预测类别为向量f(x)中最大的元素f
i
(x)对应的指标i。
[0043]
进一步地,步骤s3.1中惩罚因子c2的取值为集合{2
‑9,2
‑8,

,20,

,2
14
,2
15
},隐节点个数l2的取值为1000。
[0044]
有益效果:本系统具备以下优点:
[0045]
(1)本发明通过级联多类异常识别技术将不平衡数据多类分类问题转化为平衡的数据多类分类问题,避免样本不平衡特性会导致特征选择算法更倾向于选择能够更好区分大类样本的特征集。
[0046]
(2)本发明采用的相同的两种级联分类模型,能够直接处理2类分类和多类分类问题,避免不同分类模型带来的分类偏差。
附图说明
[0047]
图1是本发明提供的散粮集装箱物流运输过程中级联多类异常识别方法流程图。
具体实施方式
[0048]
下面结合附图对本发明作更进一步的说明。
[0049]
本发明基于级联多类异常识别的技术,首先将不平衡的多类训练样本集转换为2类训练样本集,具体做法为将所有异常类别的样本集合并为一类,再利用这些样本集训练最小二乘超限学习机(kelm)2类分类模型,然后将不平衡的多类训练样本集转化为多类训练样本集,具体做法为去掉正常样本集,再利用这些样本集训练最小二乘超限学习机(kelm)多类分类模型,最后用同样的方法处理验证样本集,再分别用训练好的kelm2类和多类分类模型对验证样本集进行预测识别,如图1所示。
[0050]
下面对两类分类模型bi

kelm

train进行介绍:
[0051]
步骤a,给定训练样本集(x
i
,t
i
),i=1,

,n,其中x
i
∈r
d
,t
i
∈{

1,1}。根据经验风险最小化原则,同时最大化分类间隔和最小化训练错误,求解两类分类模型bi

kelm

train的优化问题:
[0052][0053]
subjectto:β
·
h(x
i
)=t
i

ξ
i
,i=1,

,n
[0054]
式中,c1为用户需要调节的参数,作用是调节分类间隔和训练错误两者的权重,β为权值向量,h(
·
)为elm随机特征映射函数,ξ
i
为引入的松弛变量。
[0055]
步骤b,利用kkt优化理论,将kelm两类原始优化问题转化对偶线性优化问题求解:
[0056][0057]
其中
[0058][0059]
得到最优解α
*1
,α
i
为非负拉格朗日乘子,每个拉格朗日乘子α
i
对应着每个训练样本(x
i
,t
i
)。输入权值a和隐藏层偏置b分别从均匀概率分布(

1,1)
n
×
l1
和(0,1)
l1
中随机产生。参数c1的取值为在集合{2
‑9,2
‑8,

,20,

,2
14
,2
15
}中选取一个合适的值。隐节点个数l1的取值为1000。
[0060]
步骤c,使用训练好的二类分类模型bi

kelm

train对样本集进行预测,具体为:
[0061][0062]
当时,f(x)=1,表示预测x的类别为1;
[0063]
当时,f(x)=

1,表示预测x的类别为

1。
[0064]
下面再对多类分类模型multi

kelm

train进行介绍:
[0065]
步骤a,给定训练样本集(x
i
,t
i
),i=1,

,n,其中x
i
∈r
d
,t
i
=[t
i1
,t
i2


,t
ic
],如果样本x
i
对应的类别为k,则t
i1
=1,其余的元素为0。根据经验风险最小化原则,同时最大化
分类间隔和最小化训练错误,求解多类分类模型bi

kelm

train的优化问题:
[0066][0067][0068]
步骤b,利用kkt优化理论,将kelm多类原始优化问题转化对偶线性优化问题求解:
[0069][0070]
其中
[0071][0072]
得到最优解α
*2
,α
i
为非负拉格朗日乘子,每个拉格朗日乘子α
i
对应着每个训练样本(x
i
,t
i
)。输入权值a和隐藏层偏置b分别从均匀概率分布(

1,1)
n
×
l2
和(0,1)
l2
中随机产生。参数c2的取值为在集合{2
‑9,2
‑8,

,20,

,2
14
,2
15
}中选取一个合适的值。隐节点个数l2的取值为1000。
[0073]
步骤c,使用训练好的多类分类模型bi

kelm

train对样本集进行预测,具体为:
[0074][0075]
其中f(x)=[f1(x),

,f
c
(x)]
t

[0076]
基于上述背景技术,本发明提供的散粮集装箱物流运输过程的级联多类异常识别方法具体步骤如下:
[0077]
步骤s1、采集散粮集装箱物流运输过程的数据样本集,包括训练样本集步骤s1、采集散粮集装箱物流运输过程的数据样本集,包括训练样本集和验证样本集所述训练样本集x包括n条样本,验证样本集v包括m条样本,每条样本包括d个特征;t
i
∈{

1,1,2,

,c},表示样本类别;样本类别包括1个正常类别的样本和c个异常类别的样本,其中t
i


1表示散粮集装箱物流运输过程处于正常状态,t
i
为1到c则表示该样本处于异常状态。
[0078]
步骤s2、将训练样本集x中类别为{1,2,

,c}的所有样本合并到类别1的样本集合中,构建一级识别所需训练样本集x1;使用样本集x1训练二类分类模型bi

kelm

train,得到模型最优解α
*1
。具体地,
[0079]
步骤s2.1、选取最小二乘超限学习机kelm模型参数,包括隐节点个数l1和惩罚因子c1;
[0080]
步骤s2.2、随机赋值输入权值a和隐藏层偏置b,其中a∈r
n
×
l1
,b∈r
l1

[0081]
步骤s2.3、选取激活函数g(a,b,x),g(
·
)其中非线性分段连续函数,x为样本集x1中的样本;
[0082]
步骤s2.4、构建隐藏层输出矩阵h:
[0083][0084]
步骤s2.5、计算超限学习机核矩阵k
elm

[0085]
k
elm
=hh
t
[0086]
步骤s2.6、计算模型最优解其中i为n
×
n的单位矩阵,t=[t1,

,t
n
]
t
,t
i
∈{

1,1},i=1,

,n。
[0087]
其中惩罚因子c1的取值为集合{2
‑9,2
‑8,

,20,

,2
14
,2
15
},隐节点个数l1的取值为1000。
[0088]
步骤s3、将训练样本集x中类别为

1的样本去除,构建二级识别所需训练样本集x2;使用样本集x2训练多类分类模型multi

kelm

train,得到模型最优解α
*2
。具体地,
[0089]
步骤s3.1、选取最小二乘超限学习机kelm模型参数,包括隐节点个数l2和惩罚因子c2;
[0090]
步骤s3.2、随机赋值输入权值a和隐藏层偏置b,其中a∈r
n
×
l2
,b∈r
l2

[0091]
步骤s3.3、选取激活函数g(a,b,x),g(
·
)其中非线性分段连续函数,x为样本集x2中的样本;
[0092]
步骤s3.4、构建隐藏层输出矩阵h:
[0093][0094]
步骤s3.5、计算超限学习机核矩阵k
elm

[0095]
k
elm
=hh
t
[0096]
步骤s3.6、计算最优解其中i为n
×
n的单位矩阵,t=[t1,

,t
c
]
t
,t
i
=[t
i1
,t
i2


,t
ic
],当样本x
i
对应的类别为k时,t
i1
=1,其余的元素为0。
[0097]
其中惩罚因子c2的取值为集合{2
‑9,2
‑8,

,20,

,2
14
,2
15
},隐节点个数l2的取值为1000。
[0098]
步骤s4、将验证样本集v中类别为{1,2,

,c}的所有样本合并到类别1的样本集合中,构建一级异常验证样本集v1;通过二类分类模型bi

kelm

train对样本集v1进行验证;当预测结果为正常样本时,输出结果类别为11;当预测结果为其他类别时,进一步构建二级异常验证样本v2,进行二次验证。具体如下:
[0099][0100]
当时,f(x)=1,表示预测x的类别为1;
[0101]
当时,f(x)=

1,表示预测x的类别为

1。
[0102]
步骤s5、将验证样本集v中类别为

1的样本去除,构建二级异常验证样本v2,采用步骤s3中所述多类分类模型multi

kelm

train对样本集v2进行二级预测,得到散粮集装箱物流的具体异常类别。具体如下:
[0103][0104]
其中f(x)=[f1(x),

,f
c
(x)]
t
,x的预测类别为向量f(x)中最大的元素f
i
(x)对应的指标i。
[0105]
下面提供一份具体实施例,对本发明散粮集装箱物流运输过程的级联多类异常识别方法进行进一步验证说明。
[0106]
下面通过收集“北粮南运”散粮集装箱物流运输状态数据,对原始的不平衡数据直接使用kelm模型和本发明的级联多类识别模型进行比较。样本数据集包括102条训练样本集和101条验证样本集。训练样本集包括70条正常状态的样本和32条异常的样本(其中包括运输路线异常9条样本,箱体完整性异常3条样本,环境异常10条样本和集装箱运行异常10条样本),验证样本集包括69条正常状态的样本和30条异常的样本(其中包括运输路线异常8条样本,箱体完整性异常3条样本,环境异常9条样本和集装箱运行异常10条样本)。选取各个异常类预测错误的个数作为比较的指标。
[0107]
对原始数据集直接使用kelm模型和本发明的级联多类异常识别技术的对比结果如下表1所示。
[0108]
表1不同异常数据预测错误数目比较表
[0109] 异常类1异常类2异常类3异常类4kelm模型3232级联多类方法1021
[0110]
从表1可以看出,使用kelm模型直接对数据集进行多类分类总的错误数目是10条,而本发明的方法总的错误数目是4条。这表明,本发明的方法识别多类异常样本数据更有效。
[0111]
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献