一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种面向流程挖掘中流程执行异常的根源分析方法与流程

2022-07-16 05:45:39 来源:中国专利 TAG:


1.本发明涉及计算机流程挖掘领域,具体说是一种面向流程挖掘中流程执行异常的根源分析方法,尤指一种基于集合统计的根源分析方法。


背景技术:

2.现有的商业智能(business intelligence)软件通常假设企业流程是已知的,并且它们只执行与数据相关的分析操作(如分类、聚类、关联分析等),或在聚合层面上对流程执行的性能进行评估(如平均执行时间等)。这意味着,在当前商业智能的研究和应用中缺少对显示流程的支持,而这就形成了一个新的研究领域
‑‑
流程挖掘。
3.流程挖掘是一种从工作流日志中提取有用信息的技术。其是数据挖掘在工作流管理领域的一种较新的应用。工作流挖掘的初衷是通过对工作流运行产生的日志进行分析,重现业务流程的真实过程,利用这些知识对工作流进行分析和优化等。
4.流程挖掘始于对企业信息系统中业务执行行为的记录,而这样的执行信息通常是以事件日志的形式保存。以事件日志为基础,根据具体的分析目标,流程挖掘技术总的来说可以分为三类:流程发现、一致性检测和流程增强。
5.流程挖掘不是解决问题的技术,而是发现问题的方法。进一步,通过一致性检查技术将通过流程发现得出的模型和实际流程的各种行为或者事件日志进行比较,检测挖掘得到的模型和实际流程行为的符合程度,检验它们之间的偏差以及权衡其严重性,从而发现出目前的流程存在哪些问题。
6.根源分析的目标是识别企业真实业务流程中执行异常或者不合规的原因,并以此为基础进一步进行流程或者规范优化。实际场景中,组织中业务流程往往复杂、数量众多,且执行方式灵活多样,会产生大量的业务流程运行数据。一致性检测可以很好的识别用户执行行为与企业规范之间的偏差,但是分析导致这种偏差的原因却非常具有挑战性。根源分析技术就是在这种应用背景下提出来的。
7.根源分析以实际发生的情况为基础,便于客观地查明各种不合规行为的根本原因,从而最大限度地减少主观看法对结果的影响。它可以确定流程错误的原因,并改进或纠正给定的流程,降低错误再次发生的可能性,以避免未来发生更大的问题;同时,根源分析还可以提高产品质量和生产效率。
8.常见的根源分析方法包括:通过决策树模型构建技术进行根源分析,通过因果推断技术进行根源分析。
9.通过决策树模型构建技术进行根源分析,是指基于输入的事件日志,自动构建全量特征集合,根据具体业务场景,构建0-1类型的目标值,通过决策树的方式计算特征与目标值的相关性,将相关性作为重要度进行不合规行为的根源分析(图1)。但该方法评估构建分类器的特征重要程度过程混淆了相关性和因果关系,且该方法基于所有事件的属性值,构建高维度的特征集合,容易导致特征稀疏,模型训练效果差。而且在构建决策树过程中,需要计算流程中的全量特征,特征计算量大。
10.通过因果推断技术进行根源分析,是指引入因果方程模型对不合规流程进行根源分析,找到导致问题的特征及其影响程度,有针对性的进行流程改进,使结果更有效(图2)。该方法虽并未混淆相关性和因果关系,但需要构建因果图,最终效果严重依赖因果图的合理性。另外,该方法需要处理大量日志数据,计算量大,效率低,不适用于大数据场景下的计算。


技术实现要素:

11.针对现有技术中存在的缺陷,本发明的目的在于提供一种面向流程挖掘中流程执行异常的根源分析方法,尤指一种基于集合统计的根源分析方法。
12.该方法针对企业信息系统中积累的大量事件日志数据,在利用流程挖掘中一致性检测技术识别流程不合规行为的基础上,快速高效地分析产生各种不合规行为的原因。
13.为达到以上目的,本发明采取的技术方案是:
14.一种面向流程挖掘中流程执行异常的根源分析方法,其特征在于,包括如下步骤:
15.步骤一,基于用户选定的属性,导入大规模事件日志,并识别其中的不合规行为;
16.步骤二,按照识别的不合规行为,将导入的事件日志拆分为正常事件日志和不合规事件日志,根据正常事件日志构建合法属性值集合,并根据分析目的对不合规事件的属性值进行检查,发现异常根源;
17.步骤三,从多个维度对异常根源进行影响程度排序。
18.进一步,步骤二中:
19.构建合法属性值集合的过程为:根据正常事件日志中每个属性的全部属性值构建合法属性值集合,为(属性,属性值集合)二元组的集合;
20.对不合规事件的属性值进行检查的过程为:根据分析目的提取不合规事件日志中不合规事件的所有属性值,循环检测各个属性值是否属于对应属性的合法属性值集合,如果不属于其集合,则该属性值将作为一个异常根源。
21.进一步,步骤三所述排序过程包括:
22.从影响案例数和相关性两个维度计算异常根源对流程执行异常的影响程度,构建(属性,异常根源,相关性,影响案例数)四元组;
23.根据构建的四元组对异常根源进行排序。
24.进一步,影响案例数和相关性的计算过程为:
25.对于不合规事件的每个异常根源属性值,循环计算在该不合规行为中属性值涉及的流程实例数,作为影响案例数;
26.循环计算导入的事件日志中包含异常根源属性值的流程实例占比的倒数作为相关性。
27.进一步,异常根源排序过程为:
28.根据每个异常根源的相关性对所属属性的异常根源属性值列表进行排序;
29.根据所有四元组中影响案例数的最大值对异常根源所属属性进行排序;
30.根据所有属性中影响案例数的最大值对不合规行为进行排序。
31.本发明所述的一种面向流程挖掘中流程执行异常的根源分析方法,采用分类及集合统计的方式执行根源分析,最终效果没有对模型的依赖性,构建低维度的属性集合,计算
量小,简单快速,使得技术使用成本更低,应用范围更广,更加适应大数据场景。
附图说明
32.本发明有如下附图:
33.图1通过决策树模型构建技术进行根源分析步骤示意图;
34.图2通过因果推断技术进行根源分析步骤示意图;
35.图3本发明一种面向流程挖掘中流程执行异常的根源分析方法流程图;
36.图4正常事件日志示意图;
37.图5合法属性集构建示意图;
38.图6属性值检查示意图;
39.图7不合法属性值影响案例示意图;
40.图8包含不合法属性值流程实例示意图。
具体实施方式
41.以下结合附图对本发明作进一步详细说明。
42.本发明主要是通过一致性检测技术发现流程中的不合规行为,然后在此基础上进行根源分析,识别流程中执行异常或者不合规的原因,最终给出精确和科学的异常根源分析结果。本发明所述方法的输入是大规模事件日志,输出为流程中不合规行为的根源分析排序结果。本发明所述方法的总体流程如图3所示,其中关键流程为:
43.异常根源发现:按照识别的不合规行为,将日志集合拆分为正常事件日志与不合规事件日志,通过统计的方式,构建合法属性值集合,循环检查不合规事件的所有属性值,发现异常根源。
44.异常根源影响程度排序:为得到更为精确和科学的异常根源分析结果,根据发现的异常根源对流程执行异常的影响程度进行排序。
45.1.异常根源发现:
46.根据一致性检测技术识别的不合规行为,可以将导入的事件日志划分为正常事件日志和不合规事件日志两部分。对于正常事件日志,所有属性的属性值构建一个完备的合法属性值集合;对于不合规事件日志中的不合规事件的所有属性值,循环检测各个属性值是否属于对应属性的合法属性值集合,如果不属于其集合,则该属性值将作为一个异常根源。
47.其中:
48.1)合法属性集构建:根据正常事件日志中每个属性的全部属性值构建合法属性值集合,为(属性,属性值集合)二元组的集合。
49.2)属性值检查:根据分析目的提取不合规事件日志中不合规事件的所有属性值,循环检测各个属性值是否属于对应属性的合法属性值集合,如果不属于其集合,则该属性值将作为一个异常根源。
50.实现示例:
51.合法属性集构建:如图5,该图是根据正常事件日志(图4)中的流程实例3、2、6构建的合法属性集。
52.属性值检查:如图6,例如不合规行为“examine thoroughly不应该跟随register request”中,活动“examine thoroughly”所属的不合规事件的每个属性值循环与合法属性值集合中对应属性的所有属性值对比。属性值“sue”不在合法属性值集合,所以“sue”是一个异常根源。
53.2.异常根源影响程度排序
54.为得到更为精确和科学的异常根源分析结果,计算异常根源对流程执行异常的影响程度,对异常根源进行排序,客观地查明流程执行异常的原因及重要程度。
55.1)计算异常根源影响程度:从影响案例数和相关性两个维度计算异常根源对流程执行异常的影响程度,构建(属性,异常根源,相关性,影响案例数)四元组。
56.2)异常根源排序:分别从异常根源、属性、不合规行为三个维度对根源分析结果进行排序。a)异常根源:根据每个异常根源的相关性对所属属性的异常根源列表进行排序;b)属性:涉及到的所有四元组中影响案例数的最大值作为属性排序依据;c)不合规行为:涉及到的所有属性中影响案例数的最大值作为不合规流程排序依据。
57.3)异常根源分析结果可视化:按上述计算结果对不合规行为、属性、异常根源列表进行可视化排序,得到更为精确和科学的异常根源分析结果,便于用户查看、理解。
58.实现示例:
59.计算异常根源影响程度:主要是异常根源的影响案例数和相关性。例如属性resource中的属性值“sue”是一个异常根源,循环计算在该不合规行为中“sue”涉及的流程实例数,由图7知该异常根源影响案例数为1。例如导入的事件日志中流程实例数为6,由图8知包含该异常根源的流程实例数为2,则该异常根源的相关性为3。最后构建的四元组为(resource,sue,1,3)。
60.异常根源排序:例如不合规行为1中的三个四元组(resource,sue,1,3)、(resource,pete,2,2)、(costs,400,1,2);不合规行为2中的一个四元组(resource,sue,3,3)。
61.a)属性值维度:例如不合规行为1中对于属性resource,sue的相关性为3,pete为2,所以sue>pete;
62.b)属性维度:例如不合规行为1中对于属性resource和costs,resource涉及的四元组中影响案例数最大值为2,costs涉及的四元组中影响案例数最大值为1,所以resource>costs;
63.c)不合规行为维度:例如不合规行为1中影响案例数最大值为2,不合规行为2中影响案例数最大值为3,所以不合规行为2》不合规行为1。
64.本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献