一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于自主学习的企业风险行为实时预警方法与流程

2022-03-22 23:27:18 来源:中国专利 TAG:


1.本发明涉及一种预警方法,尤其是一种基于自主学习的企业风险行为实时预警方法。


背景技术:

2.虚开发票是指开具与实际经营业务情况不符发票的违法行为,纳税单位和个人为了达到偷税的目的或者购货单位为了某种需要在商品交易过程中开具发票时,在商品名称、商品数量、商品单价以及金额上采取弄虚作假的收发,其中,包括为他人虚开、为自己虚开、让他人为自己虚开以及介绍他人虚开时钟情况。
3.针对开票量大的企业,如何有效监控发票开票过程中的潜在风险,是每个企业面临的问题。


技术实现要素:

4.本发明的目的是克服现有技术中存在的不足,提供一种基于自主学习的企业风险行为实时预警方法,其能有效实现企业的开票风险预警,智能化程度高,安全可靠。
5.按照本发明提供的技术方案,所述基于自主学习的企业风险行为实时预警方法,所述预警方法包括如下步骤:
6.步骤1、获取待预警企业上一月度所有的销项发票信息,利用fp-growth方法对所获取的月度销项发票信息进行所需的处理,以能得到一频繁项集;
7.步骤2、获取所述待预警企业当月的销项发票信息,并提取所述任一销项发票内包含的销项货物集合,若当前销项发票的销项货物集合与步骤1中频繁项集的所有子集均不相同时,则输出一风险预警信息。
8.若当前销项发票的销项货物集合与步骤1中频繁项集中的一子集相同时,则还包括如下步骤:
9.步骤a、确定频繁项集内包含销项货物的名称,并根据频繁项集内销项货物的名称,以能确定上一月度所有频繁项集内销项货物的金额与上一月度销项发票总金额的上月频繁项占比x1;
10.步骤b、根据当月的销项发票信息,计算频繁项集内所有销项货物相对应的当月销售金额与当月目前销项发票总金额的当月频繁项占比x2;
11.步骤c、若当月频繁项占比x2小于上月频繁项占比x1,则输出一风险预警信息。
12.步骤1中,具体包括如下步骤:
13.步骤1.1、读取的所有销项发票信息,对所有销项货物进行计数与排序,并根据对所有销项货物的计数,删除低于货物支持度阈值的销项货物;
14.步骤1.2、根据步骤1.1中删除的销项货物,再次读取所有的销项发票信息,并建立去除所删除销项货物的项头表,其中,项头表包括发票序号以及与所述发票序号相对应的货物名称,货物名称按货物支持度排序;
15.步骤1.3、根据步骤1.2的项头表,建立fp树,以根据所建立的fp树能得到频繁项集,且频繁项集内的所有子集的支持度均大于一预设的子集支持度阈值。
16.步骤1.2中,货物名称按支持度将货物支持度的降序排序。
17.本发明的优点:利用fp-growth方法对所获取上一月的月度销项发票信息进行所需的处理,以能得到一频繁项集;获取所述待预警企业当月的销项发票信息,并提取所述任一销项发票内包含的销项货物集合,若当前销项发票的销项货物集合与频繁项集的所有子集均不相同时,则输出一风险预警信息,即能有效实现企业的开票风险预警,智能化程度高,安全可靠。
附图说明
18.图1为本发明的流程图。
19.图2为本发明读取到上一月度所有销项货物的信息表。
20.图3为本发明对销项货物统计后排序的示意图。
21.图4为本发明删除低于货物支持度阈值的销项货物的示意图。
22.图5为本发明建立项头表后的示意图。
23.图6为本发明利用项头表内第一张销项发票建立fp树的示意图。
24.图7为本发明利用项头表内第二张销项发票建立fp树的示意图。
25.图8为本发明利用项头表内第三张销项发票建立fp树的示意图。
26.图9为本发明利用项头表内第四张销项发票建立fp树的示意图。
27.图10为本发明利用项头表内第五张销项发票建立fp树的示意图。
具体实施方式
28.下面结合具体附图和实施例对本发明作进一步说明。
29.如图1所示,为了能有效实现企业的开票风险预警,本发明的预警方法包括如下步骤:
30.步骤1、获取待预警企业上一月度所有的销项发票信息,利用fp-growth方法对所获取的月度销项发票信息进行所需的处理,以能得到一频繁项集;
31.具体地,可以通过本技术领域常用的技术手段能获取待预警企业上一月度所有的销项发票信息,如可以通过税控盘等方式获取,具体为本技术领域人员所熟知,此处不再赘述。
32.fp-growth方法为现有常用的关联分析方法,具体实施时,利用fp-growth方法对所获取的月度销项发票信息进行所需的处理时,具体包括如下步骤:
33.步骤1.1、读取的所有销项发票信息,对所有销项货物进行计数与排序,并根据对所有销项货物的计数,删除低于货物支持度阈值的销项货物;
34.步骤1.2、根据步骤1.1中删除的销项货物,再次读取所有的销项发票信息,并建立去除所删除销项货物的项头表,其中,项头表包括发票序号以及与所述发票序号相对应的货物名称,货物名称按货物支持度排序;
35.具体地,货物名称按支持度将货物支持度的降序排序。
36.步骤1.3、根据步骤1.2的项头表,建立fp树,以根据所建立的fp树能得到频繁项
集,且频繁项集内的所有子集的支持度均大于一预设的子集支持度阈值。
37.具体实施时,货物支持度阈值、子集支持度阈值具体可以根据时机需要选择,具体以企业所在的行业等综合判断,具体为本技术领域人员所熟知,此处不再赘述。
38.如图2~图10为本发明利用fp-growth方法对所获取的月度销项发票信息进行所需的处理,建立fp数的具体过程步骤示意图,其中
39.对于任一企业,可根据所述企业的名称确定所述企业的识别号,一般地,销售方识别号即为所述企业的统一信用代码,图2中,销项货物的名称用s1、s2等表示,具体地,图2中销项货物分别为s1、s2、s3、s4以及s5;同时,图1中示出了5张销项发票信息的情况,5张销项发票的序号分别为1至5,对于第一张销项发票,其包含的销项货物为s1、s2以及s4;对于序号为2的销项发票,其包含的销项货物为s1、s3、s4以及s5。对于序号为3的销项发票,其包含的销项货物为s1、s2以及s4。对于序号为4的销项发票,其包含的销项货物为s2、s3以及s4;对于序号为5的销项发票,其包含的销项发票为s1以及s3。
40.一般地,图2中即示出了获取或读取待预警企业上一月度的销项发票信息。在对所有销项发票的销项货物出现的次数统计,即可得到图3的排序结果。一般地,货物支持度阈值可为20%,根据货物支持度阈值要删除的销项货物为s5,即如图4所示。
41.在确定要删除的销项货物后,利用读取或获取上一月度的销项发票信息能建立项头表,此时,项头表中不包含被删除的销售货物s5,当然,具体实施时,被删除的销售货物可以为一个或多个,或者不存在需要被删除的销售货物,具体与货物支持度阈值等情况确定,具体为本技术领域人员所熟知,此处不再赘述。
42.图5中,在项头表内,每张销项发票对应的货物名称按支持度降序排序,如序号为1的销项发票排序结果为s1、s4以及s2,具体可以参考上述图2、图3,对于其他销项发票的排序情况,此处不再不再一一赘述。
43.图6~图10为根据项头表内5张销项发票建立fp树的过程,具体地,建立fp树时:读入排序后的项头表,插入fp树,插入时按照排序后的顺序,插入fp树中,排序靠前的节点是父节点,而靠后的是子节点。如果有共同的链表,则对应的公用父节点计数加1。插入后,如果有新节点出现,则项头表对应的节点会通过节点链表链接上新节点,直到所有的数据都插入到fp树后,fp树的建立完成,具体建立fp数的过程可以参考图示说明,为本技术领域人员所熟知,此处不再赘述。
44.在建立fp树后,需要挖掘频繁项集。从项头表的底部项依次向上找到项头表项对应的条件模式基。从条件模式基递归挖掘得到项头表项的频繁项集,同时返回频繁项集对应的节点计数值。此外,如果不限制频繁项集的项数,则返回频繁项集的挖掘,否则,只返回满足项数要求的频繁项集。
45.根据图10建立的fp树,由上排列,从下到上依次获取频繁项,以上求出为子集支持度阈值大于20%的频繁项集的结果,如下:{(s1,s2),(s1,s3),(s1,s4),(s2,s4),(s3,s4),(s1,s2,s4)},即频繁项集包含的子集分别为:(s1,s2)、(s1,s3)、(s1,s4)、(s2,s4)、(s3,s4)、(s1,s2,s4)。
46.在建立fp树后,根据子集支持度阈值确定频繁项集的具体过程与现有相一致,此处不再赘述。当然,在具体实施时,根据上述步骤过程,对上一月度所有的销项发票信息进行处理后,即可得到一相应的频繁项集,具体为本技术领域人员所熟知,此处不再赘述。
47.步骤2、获取所述待预警企业当月的销项发票信息,并提取所述任一销项发票内包含的销项货物集合,若当前销项发票的销项货物集合与步骤1中频繁项集的所有子集均不相同时,则输出一风险预警信息。
48.本发明实施例中,对于任一企业,相邻月度的销项发票信息一般相差不大,从而在获取上一月度的频繁项集后,可以根据上一月度的频繁项集对当月的销项发票信息预警。具体地,若当前销项发票的销项货物集合与步骤1中频繁项集的所有子集均不相同时,则输出一风险预警信息,即当前销项发票的销项货物不是上一月度高频开出的货物名称,则可判断存在风险,以便后续的税务稽查等。
49.此外,若当前销项发票的销项货物集合与步骤1中频繁项集中的一子集相同时,则还包括如下步骤:
50.步骤a、确定频繁项集内包含销项货物的名称,并根据频繁项集内销项货物的名称,以能确定上一月度所有频繁项集内销项货物的金额与上一月度销项发票总金额的上月频繁项占比x1;
51.本发明实施例中,若当月开出销项发票的销项货物集合为频繁项集内的一子集相同,则可以进行后续的判断。具体地,由于读取到上一月度所有的销项发票信息,从而上一月度所有频繁项集内销项货物的金额;如上述频繁项集内的货物分别为s1、s2、s3以及s4,则可以查找所有包含货物s1发票对应的价格与数量,从而能确定所有s1的金额,同理,可以得到s2、s3以及s4的金额,将s1、s2、s3以及s4的销项金额相加,即可确定上一月度所有频繁项集内销项货物的金额。上一月度销项发票总金额可以根据上一月度所有销项发票的信息直接获得,具体为本技术领域人员所熟知。因此,在确定频繁项集后,即可能得到上月频繁项占比x1,具体计算得到上月频繁项占比x1的过程为本技术领域人员所熟知,此处不再赘述。
52.步骤b、根据当月的销项发票信息,计算频繁项集内所有销项货物相对应的当月销售金额与当月目前销项发票总金额的当月频繁项占比x2;
53.具体实施时,当月的销项发票信息可以通过读取等方式获取,具体可与上一月度销项发票信息获取方式相一致,具体为本技术领域人员所熟知,此处不再赘述。具体计算频繁项集内所有销项货物相对应的当月销售金额以及确定当月目前销项发票总金额的具体过程可以参考上述说明,此处不再赘述。因此,对于本技术领域人员,可以通过计算得到当月频繁项占比x2。
54.步骤c、若当月频繁项占比x2小于上月频繁项占比x1,则输出一风险预警信息。
55.本发明实施例中,当月频繁项占比x2小于上月频繁项占比x1时,即说明开票的销项货物与上月存在偏差,可认为存在异常,此时,宜输出风险警示信息。当然,在具体实施时,可以根据企业所在的行业等情况,设置当月频繁项占比x2与上月频繁项占比x1间差值的阈值,当差值小于阈值时,可认为不存在风险,而当差值大于阈值时,则认为存在风险,具体实施时,可以根据实际需要选择,差值阈值的具体情况也可以根据需要设置,此处不再赘述。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献