一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

针对并发导致的不完备事件日志的块结构过程挖掘方法与流程

2022-03-19 21:45:29 来源:中国专利 TAG:


1.本发明属于业务过程领域,具体涉及一种针对并发导致的不完备事件日志的块结构过程挖掘方法。


背景技术:

2.在大数据和数字化时代,许多企业都部署了信息系统来更好地管理企业资源,提升运营效率。企业的信息系统在日常运行中,收集记录了大量的事件数据,例如,企业财务审计日志,供应链采购事件数据等。由于企业的业务需求可能会发生变化,导致业务过程可能也会发生变化,管理者要想对当前的业务过程进行改进就需要企业当前真实的业务过程。而企业最近一段时间的事件日志便能体现企业当前真实的业务过程。过程挖掘技术可以这些事件日志中挖掘出业务过程模型,企业管理者可以通过分析过程模型找到“瓶颈”并改进业务过程,从而达到降低运营成本,提高运营效率的目的。
3.事件日志包含了许多事件序列,而事件又包括活动名称、发生时间、操作者、动作等信息。目前主流的过程挖掘算法都依赖于高质量的事件日志,比如要求事件日志满足其定义的完备性,才能够保证挖掘出质量较高的过程模型。但是,真实的业务过程中往往包含并发活动,包含并发活动的事件日志往往很难满足过程挖掘算法所需要的完备性,导致挖掘出的过程模型质量较差。


技术实现要素:

4.本发明的目的在于提供一种针对并发导致的不完备事件日志的块结构过程挖掘方法。
5.实现本发明目的的技术解决方案为:一种针对并发导致的不完备事件日志的块结构过程挖掘方法,根据事件日志信息,挖掘块结构过程模型;以xes格式的事件日志作为输入,以ptml格式的过程模型作为输出,过程模型为一棵过程树,是一种块结构的过程模型,叶子结点为事件日志中的事件,非叶子结点为选择、顺序、循环和并发中的一种,过程树的每一个子树都是一个块结构;该方法具体步骤为:
6.步骤1,对于一个事件日志,利用inductive miner中基于直接在前关系的切分操作对其包含的事件进行切分,切分操作的结果是若干事件集合,根据事件集合从原事件日志中根据投影拆分出其对应的子日志;此时可得到一棵初步的过程树,切分操作的类型对应于根结点,拆分出的子日志为其孩子结点;继续对子日志重复以上操作进行拆分,直到子日志中只包含一个事件为止;对于无法正常进行拆分的子事件日志,判断其每一条事件序列中是否存在重复和互斥出现的事件,若存在则对于该事件日志返回一个可以产生任何事件序列的块结构鲜花模型,否则进入步骤2;
7.步骤2,对步骤1中未能正确处理的子日志,遍历其中的事件序列获取事件之间的传递在前关系,并生成对应的0-1矩阵,矩阵中的元素1表示存在传递在前关系,0表示不存在传递在前关系,其余表示不确定;使用协同过滤对0-1矩阵中不确定的元素进行推断确定
其是否存在传递在前关系;随后根据推断结果生成传递在前图,使用应用在传递在前图上的选择切、顺序切或并发切进行切分操作,并根据拆分结果对事件日志进行拆分;如果可以正常拆分则可获得该子日志对应的块结构,否则返回一个该事件日志对应的鲜花模型;
8.步骤3,根据嵌套关系,将所有块结构组合成一个过程树表示的块结构过程模型。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的针对并发导致的不完备事件日志的块结构过程挖掘方法。
10.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的针对并发导致的不完备事件日志的块结构过程挖掘方法。
11.相较于inductive miner及其衍生算法以及主流的过程挖掘算法alpha算法,本发明可以更好地处理由并发导致的不完备事件日志,挖掘出准确性更高的过程模型,并且所发现的块结构过程模型更容易分析与理解。
附图说明
12.图1是本发明针对并发导致的不完备事件日志的块结构过程挖掘方法流程图。
13.图2是过程树形式展示的过程模型示意图。
14.图3是以xes格式描述的事件日志文件示意图。
15.图4是解析xes格式的事件日志文件得到的事件序列集合s示意图。
16.图5是从事件日志中提取的传递在前矩阵示意图。
17.图6是在传递在前图上应用并发切的过程示意图。
具体实施方式
18.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
19.本发明公开了一种针对并发导致的不完备事件日志的块结构过程挖掘方法,所谓事件日志,是多条事件序列的集合,事件包含了活动名称、时间戳、资源等信息,若只考虑事件名称和时间戳,事件序列可简化为一系列具有先后发生顺序的事件名序列。本发明以xes格式描述的事件日志作为输入,以ptml格式描述的过程模型作为输出,具体流程如附图1所示,具体步骤如下:
20.步骤1,对于一个事件日志,利用inductive miner中基于直接在前关系的切分操作(选择切、顺序切、循环切和并发切)对其包含的事件进行切分,并根据切分结果对事件日志进行拆分,直到子日志中仅包含一个事件为止,具体步骤如下:
21.步骤1-1,对不完备事件日志使用inductive miner中定义的基于直接在前关系的切分操作进行拆分以确定不同的块结构与其之间的嵌套关系,直到子日志中只含有一个事件(即无法继续拆分),对于无法正常拆分的子日志需进一步处理;
22.步骤1-2,对于步骤1-1中无法正常处理的子日志,判断其包含的每一个事件序列
中是否存在重复事件或互斥出现的事件(即是否对应于一个循环或选择结构),如果是则对该事件日志返回一个块结构的鲜花模型,否则需进一步处理;
23.步骤2,对步骤1中未能正确处理的子日志,遍历其中的事件序列获取事件之间的传递在前关系,并生成对应的0-1矩阵,矩阵中的元素1表示存在传递在前关系,0表示不存在传递在前关系,其余表示不确定;使用协同过滤对0-1矩阵中不确定的元素进行预测确定其是否存在传递在前关系;随后根据预测结果生成传递在前图,使用应用在传递在前图上的选择切、顺序切或并发切进行切分操作,并根据切分结果对事件日志进行拆分;如果可以正常拆分则可以获得该子日志对应的块结构,否则返回一个该事件日志对应的鲜花模型,具体步骤如下:
24.步骤2-1,对步骤1中未能处理的子日志遍历所有事件序列,获取所有存在传递在前关系的事件对。具体包括:任意一条事件序列{a1,a2,a3,
……
,a
n-1
,an},包含n个事件,其中ai表示事件i,这n个事件按照发生的先后顺序排列,可获得n*(n-1)/2组的传递在前关系对:a1>a2,a1>a3,

,a1>an,a2>a3,a2>a4,

,a2>an,

,a
n-1
>an。其中,ai>aj代表事件ai传递发生在事件aj之前。根据事件之间的传递在前关系生成传递在前0-1矩阵,矩阵中的第一行、第一列均为事件名称,其余元素若为1表示该元素对应的事件对之间存在传递在前关系,为0表示不存在传递在前关系,其他表示不确定是否存在传递在前关系;
25.步骤2-2,对于0-1矩阵中不确定的元素所对应的事件对《ai,aj》,记ai所在行向量[a1,a2,
……
,a
i-1
,a
i 1
,
……
,a
j-1
,a
j 1
,
……
,a
n-1
,an]为vi,aj所在列向量[a1,a2,
……
,a
i-1
,a
i 1
,
……
,a
j-1
,a
j 1
,
……
,a
n-1
,an]
t
为vj,其中n为矩阵中的事件个数,在计算过程中不确定的元素看作0;根据公式其中a和b表示向量,计算vi与其他行向量的余弦相似度,取除了aj所在行向量以外的相似度最高的前个的事件记为集合su;计算vj与其他列向量的余弦相似度,取除了ai所在列向量以外的相似度最高的前个的事件记为集合si;
[0026]
步骤2-3,根据步骤2-2计算出所有不确定是否存在传递在前关系的事件对的su和si集合,对于矩阵中每一个不确定的元素m
x,y
,其推断结果rating
x,y
根据公式
[0027][0028]
来计算,其中m
r,c
表示矩阵中事件ar与事件ac处的元素值,m
r,y
与m
x,c
同理,r表示来自集合su的事件ar,c表示来自集合si的事件ac,λ和δ为线性插值参数,默认固定为0.5;将所有推断结果按照升序排列,设推断结果总数为m,则取第个数作为阈值,推断值大于该阈值或者达到1,对应的事件对判断为存在传递在前关系,否则不存在,结合之前已经确定的存在传递在前关系的事件对,我们可以生成传递在前图tpg,顶点为事件,有向弧表示从起始时间到目标事件存在传递在前关系;
[0029]
步骤2-4,根据步骤2-3中得到的tpg,定义三种应用在tpg上的切分操作,选择切、
顺序切和并发切,具体定义为:
[0030]
选择切:一个选择切可以将tpg切分成多个事件集合∑1,

,∑m,事件集合须满足:
[0031]
·
[0032]
顺序切:一个顺序切可以将tpg切分成多个有序的事件集合∑1,

,∑m,事件集合须满足:
[0033]
·
[0034]
·
[0035]
并发切:一个并发切可以将tpg切分成多个事件集合∑1,

,∑m,事件集合须满足:
[0036]
·
其中表示事件ai到事件aj之间存在传递在前关系,即在tpg中存在一条直接可达的路径;按照选择切、顺序切和并发切的顺序,选择一个能将tpg切分最多个子tpg的切分进行切分操作,可得到若干子tpg对应的事件集合,并记录切分操作的类型。根据事件集合从不完备的子日志中拆分出对应的子日志,重复以上切分操作直到所有子日志中仅包含一个事件为止;在此过程中如遇到无法正常拆分的子日志,便返回一个该子日志对应的鲜花模型。
[0037]
步骤3,根据嵌套关系,将所有块结构组合成一个过程树表示的块结构过程模型。
[0038]
下面结合具体实施例对本发明作进一步说明。
[0039]
实施例
[0040]
本发明为针对并发导致的不完备事件日志的块结构过程挖掘方法。以xes格式描述的事件日志作为输入,输出一棵过程树表示的块结构过程模型。
[0041]
结合实例,该方法具体的操作步骤为:
[0042]
步骤1,图2展示了一个由过程树形式建模的业务过程p,图3所示为p产生的一个事件日志l的部分展示,该文件由xes格式描述,其中trace标签代表事件序列,event标签代表事件;该事件日志共包含6条事件序列(trace),只考虑事件的活动名,所得到的事件序列集合s如图4所示;通过inductive miner定义的基于直接在前关系的切分操作进行切分得到的初步结果为:顺序《{a1},{a2},循环《顺序《{a3},{a4,a5,a6,a7,a8,a9},{a
10
}》,{a
11
}》,{a
12
}》;按照切分结果对事件日志进行投影拆分可以得到一棵过程树(块结构),其表达式为:顺序(a1,a2,循环(顺序集合a4,a5,a6,a7,a8,a9对应的子日志由于并发活动的缘故导致其不满足inductive miner要求的直接在前完备性,因此无法正常进行切分操作;又因为不包含重复事件或互斥出现的事件,因此无需生成鲜花模型。
[0043]
步骤2,提取步骤1无法处理的事件日志中的传递在前关系生成如图5所示的0-1矩阵。在传递在前矩阵中,存在5个事件对不能确定是否存在传递在前关系,分别为《a5,a4》,《a7,a4》,《a7,a6》,《a9,a4》,《a9,a8》,经过计算得到其预测评分由小到大为:r《a7,a6》=0.8917,r《a9,a8》=0.8917,r《a5,a4》=0.9442,r《a7,a4》=0.9452,r《a9,a4》=0.9452,取2/3位数0.9442为阈值,则判定事件对《a7,a4》与《a9,a4》存在传递在前关系;根据预测结果得到传递在前图,并使用应用在传递在前图上的并发切如图6所示,得到结果为:并发《{a4,a5},{a6,a7},{a8,a9}》;根据切分结果对进行投影拆分又可以得到一棵子
过程树(块结构),其表达式为:并发继续对子日志和进行拆分,结果为:顺序(a4,a5),顺序(a6,a7),顺序(a8,a9)。
[0044]
步骤3,将步骤2中的所有块结构进行组合,成功获得如图1所示的过程树形式展示的过程模型;该过程模型与输入的事件日志对应的业务过程一致,这说明本发明可以正确的处理由并发导致的不完备事件日志。
[0045]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献