一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种适用于财税领域指标自定义和自动化运行的应用的制作方法

2022-02-20 00:30:12 来源:中国专利 TAG:

技术特征:
1.一种适用于财税领域指标自定义和自动化运行的应用,其特征在于,所述应用包括以下方法:步骤1:将税务数据按照设定的特征划分为多个数据群;所述设定的特征包括:时间特征和/或款项特征;同时,统计每个数据群中可能存在的彼此交集部分;步骤2:在每个数据群内部进行数据关联,具体包括:对数据群中的每个数据均进行分析,以计算该数据与其他数据的关联程度值,并将关联的数据进行连接;步骤3:在每个数据群内部使用预设的数据分析模型进行数据风险分析,得到该数据群对应的风险权值;再对每个交集部分进行数据风险分析,得到交集部分对应的风险权值;基于数据群对应的风险权值和交集部分对应的风险权值,求出非交集部分的风险权值;步骤4:当接收到风险指标生成命令时,对风险指标生成命令进行分析,以获得风险指标生成命令的税务数据群;筛选出税务数据群后,使用判别器判断筛选出的税务数据群是否存在交集的部分,若存在,则将所有交集的部分所对应的风险权值进行累加,再计算所有非交集部分的风险权值,基于计算出的非交集部分的风险权值的大小,按照从大到小的顺序将非交集部分进行排序,筛选出风险权值排列在前三的非交集部分;步骤5:在非交集部分和交集部分中,基于风险指标生成命令,找到入口值,基于入口数据,在每个交集部分和非交集部分中,开始数据搜寻,具体包括:从入口数据开始,找到与前一数据的关联成都值最高的数据,作为下一数据,直到遍历到数据的终点;步骤6:基于每个非交集部分和交集部分中进行数据搜寻找到的所有数据在每个非交集部分或交集部分中的占比,求取最终的风险权值,作为生成的风险指标。2.如权利要求1所述的方法,其特征在于,所述步骤1中,所述时间特征包括:税务数据产生的时间和/或被记录的时间;所述款项特征包括:税务数据的来源和/或用途。3.如权利要求2所述的方法,其特征在于,所述步骤2中对数据群中的每个数据均进行分析,以计算该数据与其他数据的关联程度值的方法执行以下步骤:将数据群中的每个数据的特征进行分类处理,得到组成所述特征的分类;所述特征为设定的特征的一种或多种;对各分类进行隶属标注,得到各分类的隶属类型;按照预设的隶属类型优先级顺序,从各分类中选择隶属类型与预设的隶属类型相同且优先级最高的分类作为关联特征;从数据群中中,获取特征中包含所述关联特征的数据;从获取到的数据中,确定与所述数据群中待关联数据的关联的数据。4.如权利要求3所述的应用,其特征在于,从获取到的数据中,确定与所述数据群中待关联数据的关联的数据具体包括:根据待关联数据与各获取到的数据的特征信息,确定待关联数据与各获取到的数据的相似度;根据各数据的相似度,确定与待关联数据关联的数据。5.如权利要求4所述的应用,其特征在于,若数据的特征包含数据产生的时间、被记录的时间、税务数据的来源和用途,则所述根据待关联数据与获取到的数据的特征信息,确定待关联数据与各获取到的数据的相似度,具体包括:根据待关联数据与数据的数据产生的时间,确定待关联数据与该数据的数据产生的时间的相似度;根据待关联数据的被记录的时间与该数据的被记录的时间,确定待关联数据与该数据的被记录的时间相似度;根据待关联数据与该数据的来源,确定待关联数据与该数据的来源相似度;根据待关联数据与该数据的用途,确定待关联数据与该数据的用途相似度;根据所述产生的时间相似度、被记录
的时间相似度、来源相似度以及用途相似度,确定待关联数据与该数据的相似度。6.如权利要求5所述的应用,其特征在于,所述步骤3中在每个数据群内部使用预设的数据分析模型进行数据风险分析的方法执行以下步骤:所述数据分析模型使用如下公式进行表示:其中,r为风险权值;dm为风险阈值,为一个设定值;d为数据群的风险值;当通过计算得到数据群的风险值后,再将风险值代入到数据分析模型中,则可以得到风险权值。7.如权利要求6所述的应用,其特征在于,所述数据群的风险值的计算方法执行以下步骤:从数据群中选出一个数据作为起始值,使用如下公式计算该起始值的风险值:其中,t为数据值,k为该数据与其他关联的数据的关联程度值的均值;得到起始值的风险值后,再从与该起始值的关联程度值最高的其他数据值开始,重复计算风险值,直到数据群中所有的数据的风险值都计算完毕后;计算所有风险值的平均值作为数据群的风险权值。8.如权利要求7所述的应用,其特征在于,所述方法还包括在对数据按照设定的特征划分为多个数据群之前,对税务数据进行数据预处理的步骤;具体包括:对待预处理的税务数据进行结构化处理,得到结构化的税务数据;所述税务数据中包括需要预处理的数据字段;确定各数据字段对应的属性以及从属于各属性的预处理规则;利用从属于各属性的预处理规则形成预处理规则集;基于所述预处理规则集对所述税务数据进行预处理。9.如权利要求8所述的应用,其特征在于,所述基于所述预处理规则集对所述税务数据进行预处理,包括:获取所述税务数据的数据量;当所述数据量超出预设阈值时,按照所述数据量生成多个数据预处理任务;所述数据清洗任务中包括需要预处理的数据字段列子集和/或数据字段行子集;从所述预处理规则集中为每个数据预处理任务配置对应的预处理规则子集;分布式执行所有的数据预处理任务。

技术总结
本发明属于计算机技术领域,具体涉及一种适用于财税领域指标自定义和自动化运行的应用。所述应用包括以下方法:步骤1:将税务数据按照设定的特征划分为多个数据群;所述设定的特征包括:时间特征和/或款项特征;同时,统计每个数据群中可能存在的彼此交集部分;步骤2:在每个数据群内部进行数据关联,具体包括:对数据群中的每个数据均进行分析,以计算该数据与其他数据的关联程度值,并将关联的数据进行连接。其通过将税务数据分解为多个数据群,再在数据群内部通过关联程度值进行关联,最后通过风险权值的计算的分散和整合来征程税务风险指标,大幅度提升了效率和准确率。大幅度提升了效率和准确率。大幅度提升了效率和准确率。


技术研发人员:吴俊 刘冬 黄友善 姜汉峰
受保护的技术使用者:税安科技(杭州)有限公司
技术研发日:2021.10.11
技术公布日:2022/1/6
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献