一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

财务数据的异常分析方法、装置、电子设备及存储介质与流程

2022-12-20 00:05:02 来源:中国专利 TAG:


1.本技术涉及数据分析技术领域,具体而言,涉及一种财务数据的异常分析方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.在企业贷款时,尤其是小微企业贷款,需要对其进行资质评价和异常评定,而中小企业由于规模小,没有财务报表或财务不规范等原因,难以用传统财务评级模型对中小企业进行全面的信用评级,因此,现有的很多银行在对中小企业进行授信审批时会转到人工环节,通过审批小组的经验判断、人工信息交叉验证,对审批流程做出决策。
3.然而,这种方式耗时较长,并且用户提交的流水材料无法编辑,需要业务审批人员手动核算,工作技术含量低、需要耗费大量人力物理、耗费时间长、且容易出错、存在操作异常。


技术实现要素:

4.本技术实施例的目的在于提供一种财务数据的异常分析方法、装置、电子设备及计算机可读存储介质,可以对虚拟资源分析过程中的财务数据进行分析,无需人工审核,缩短审核时间,减小出错概率,节省人力物力。
5.第一方面,本技术实施例提供了一种财务数据的异常分析方法,所述方法包括:
6.获取财务数据;
7.根据预先构建的风控模型对所述财务数据进行特征提取,得到财务数据特征;
8.根据所述财务数据和预先获得的离线模型结果进行参数配置,得到风控参数;
9.根据所述财务数据特征和所述风控参数获得所述财务数据对应的标签;
10.根据所述标签获得分析结果。
11.在上述实现过程中,通过对财务数据进行特征提取,并对财务数据和离线模型结果进行参数配置,得到标签,再根据标签获得分析结果,可以对虚拟资源分析过程中的财务数据进行分析,无需人工审核,缩短审核时间,减小出错概率,节省人力物力。
12.进一步地,在所述获取财务数据的步骤之前,还包括:构建风控模型。
13.进一步地,预先构建所述风控模型的步骤,包括:
14.构建基础机器学习模型;
15.获取指标数据、标签信息和非结构化数据;
16.将所述指标数据、所述标签信息和所述非结构化数据输入所述基础机器学习模型进行训练,得到所述风控模型。
17.在上述实现过程中,指标数据、标签信息和非结构化数据可以表达出数据的内容和结构,使得指标数据、标签信息和非结构化数据的特征更加明显,有利于提高分析结果,并且利用指标数据、标签信息和非结构化数据进行训练,可以减少训练过程中的冗余。
18.进一步地,预先获得所述离线模型结果的步骤,包括:
19.获取历史财务数据;
20.将所述历史财务数据输入所述风控模型,得到所述离线模型结果。
21.在上述实现过程中,根据历史财务数据获得离线模型结果,可以增加异常分析过程中的参考性,使得异常分析更加稳定,提高分析结果的准确性。
22.进一步地,所述根据所述财务数据和预先获得的离线模型结果进行参数配置,得到风控参数的步骤,包括:
23.根据所述财务数据和所述离线模型结果配置比例参数、阈值和关键字;
24.根据所述比例参数、所述阈值和所述关键字获得所述风控参数。
25.在上述实现过程中,根据比例参数、阈值和关键字获得风控数据,使得风控数据中包含多种关键信息,提高风控参数的实用性,缩短获得分析结果的时间。
26.第二方面,本技术实施例还提供了一种财务数据的异常分析装置,所述装置包括:
27.获取模块,用于获取财务数据;
28.特征提取模块,用于根据预先构建的风控模型对所述财务数据进行特征提取,得到财务数据特征;
29.参数配置模块,用于根据所述财务数据和预先获得的离线模型结果进行参数配置,得到风控参数;
30.数据获得模块,用于根据所述财务数据特征和所述风控参数获得所述财务数据对应的标签;
31.分析模块,用于根据所述标签获得分析结果。
32.在上述实现过程中,通过对财务数据进行特征提取,并对财务数据和离线模型结果进行参数配置,得到标签,再根据标签获得分析结果,可以对贷款过程中的财务数据进行分析,无需人工审核,缩短审核时间,减小出错概率,节省人力物力。
33.进一步地,所述装置还包括构建模块,用于:
34.构建风控模型。
35.进一步地,所述构建模块还用于:
36.构建基础机器学习模型;
37.获取指标数据、标签信息和非结构化数据;
38.将所述指标数据、所述标签信息和所述非结构化数据输入所述基础机器学习模型进行训练,得到所述风控模型。
39.在上述实现过程中,指标数据、标签信息和非结构化数据可以表达出数据的内容和结构,使得指标数据、标签信息和非结构化数据的特征更加明显,有利于提高分析结果,并且利用指标数据、标签信息和非结构化数据进行训练,可以减少训练过程中的冗余。
40.第三方面,本技术实施例提供的一种电子设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述的方法的步骤。
41.第四方面,本技术实施例提供的一种计算机可读存储介质,所述存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行如第一方面任一项所述的方法。
42.第五方面,本技术实施例提供的一种计算机程序产品,所述计算机程序产品在计
算机上运行时,使得计算机执行如第一方面任一项所述的方法。
43.本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。
44.并可依照说明书的内容予以实施,以下以本技术的较佳实施例并配合附图详细说明如后。
附图说明
45.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
46.图1为本技术实施例提供的财务数据的异常分析方法的流程示意图;
47.图2为本技术实施例提供的财务数据的异常分析装置的结构组成示意图;
48.图3为本技术实施例提供的电子设备的结构组成示意图。
具体实施方式
49.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述。
50.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
51.下面结合附图和实施例,对本技术的具体实施方式作进一步详细描述。以下实施例用于说明本技术,但不用来限制本技术的范围。
52.实施例一
53.图1是本技术实施例提供的财务数据的异常分析方法的流程示意图,如图1所示,该方法包括:
54.s1,获取财务数据;
55.s2,根据预先构建的风控模型对财务数据进行特征提取,得到财务数据特征;
56.s3,根据财务数据和预先获得的离线模型结果进行参数配置,得到风控参数;
57.s4,根据财务数据特征和风控参数获得财务数据对应的标签;
58.s5,根据标签获得分析结果。
59.在上述实现过程中,通过对财务数据进行特征提取,并对财务数据和离线模型结果进行参数配置,得到标签,再根据标签获得分析结果,可以对虚拟资源分析过程中的财务数据进行分析,无需人工审核,缩短审核时间,减小出错概率,节省人力物力。
60.本技术实施例,利用机器学习算法,例如光学字符识别(optical character recognition,ocr)算法、神经语言程序学(neuro-linguistic programming,nlp)算法等,结合财务数据,从挖掘量化类、ocr类、nlp类三大方面对财务数据的数据价值进行充分挖掘,将散落在工商报告、涉诉记录、裁判文书中的有效信息结构化,打造智能审批机器人流程自动化(robotic process automation,rpa),提供信息搜集及文本摘要功能,全面提升小企业的风控水平、自动化审批效率和运营管理能力等。
61.rpa主要的功能就是将工作信息与业务交互通过机器人来按照自先设计的流程去执行。这样如果当工作信息与业务交互过多时,rpa就可以高效解决这些复杂的流程,节约人工成本。rpa主要通过各种封装好的控件,让用户能利用拖拉拽控件,简单的操作生成自动化流程,在电脑上实现浏览器应用程序自动鼠标点击、键盘输入、excel操作、数据处理、定时执行、自动生成界面交互。基础的工具型rpa由控制器、编辑器及运行器组成。应用场景包括财务会计、人力资源、采购、供应链管理等等,如费用报销、单据审核、人员入职、开具证明、订单核对等等。
62.在本技术实施例中,rpa是利用软件来执行业务流程的一组技术,按照银行的执行规则和操作过程来执行同样的流程。rpa技术可以降低工作中的人力投入,避免人为的操作错误,处理时间将会大大降低,可以转换到更加高阶的工作环境中。
63.rpa的使用可以使得银行实现全生命周期管理自动化需求、自下而上挖掘自动化机会、快速生成需求说明文档和智能分析流程持续提升投资回报率(return on investment,roi)。并且,桌面端和移动端简单易用、快速上手,有丰富的组件模板,开箱即用,可以自定义人工智能(artificial intelligence,ai)功能,数智升级,公有云/私有云部署。
64.这为银行的全面管理、调度、监控提供了很大帮助,还可以洞案业务全景,提升运作效率,追溯可审计权限隔高安全合规。
65.随着ai技术的应用和普及,rpa成为企业流程梳理及治理的加速器。除了工具习惯,rpa的发展必须依赖于ai技术,可以认为rpa正在成为ai技术最重要的应用场景;在rpa流程中,ai技术已经得到广泛应用。通过典型的ai技术,如ocr、nlp等技术,rpa平台的能力不断增强,正在帮助银行的流程治理逐步实现智能化、便捷化。
66.在s1中,获取需要虚拟资源分析的公司的财务数据的过程包括,分别从虚拟资源分析申请案件中公司维度和自然人维度获取关联公司。从所有的关联公司中按持股比例、公司年收入的维度筛选出有影响的关联公司。其中比例和年收入的可配置。再获取所有关联公司涉及到的裁判文书、失信公告、开庭公告、处罚公告等信息,通过以上多种信息、数据构成财务数据。
67.进一步地,预先构建风控模型的步骤,包括:
68.构建基础机器学习模型;
69.获取指标数据、标签信息和非结构化数据;
70.将指标数据、标签信息和非结构化数据输入基础机器学习模型进行训练,得到风控模型。
71.在上述实现过程中,指标数据、标签信息和非结构化数据可以表达出数据的内容和结构,使得指标数据、标签信息和非结构化数据的特征更加明显,有利于提高分析结果,并且利用指标数据、标签信息和非结构化数据进行训练,可以减少训练过程中的冗余。
72.可选地,基础机器学习模型包括根据多种机器学习算法构建的模型,例如,根据ocr构建基础机器学习模型,ocr是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的
技术。衡量一个根据ocr构建的基础机器学习模型的性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
73.ocr是自动识别技术研究和应用领域中的一个重要方面。它是一种能够将文字自动识别录入到电脑中的软件技术,是与扫描仪配套的主要软件,属于非键盘输入范畴,需要图像输入设备主要是扫描仪相配合。
74.根据ocr构建的基础机器学习模型主要包括几个步骤:
75.图像处理步骤,包括:
76.图像处理步骤主要具有文稿扫描、图像缩放、图像旋转等功能。通过扫描仪输入后,文稿形成图像文件,图像处理模块可对图像进行放大,去除污点和划痕,如果图像放置不正,可以手工或自动旋转图像,目的是为文字识别创造更好的条件,使识别率更高。
77.版面划分步骤,包括:
78.版面划分步骤主要包括版面划分、更改划分,即对版面的理解、字切分、归一化等,可选择自动或手动两种版面划分方式。目的是告诉基础机器学习模型将同一版面的文章、表格等分开,以便于分别处理,并按照怎样的顺序进行识别。
79.文字识别步骤,包括:
80.文字识别步骤是ocr软件的核心部分,文字识别模块主要对输入的汉字进行“阅读”,但不能一目多行,必须逐行切割,对于汉字通常也是一个字一个字地辨认,即单字识别,再进行归一化。文字识别模块通过对不同样本汉字的特征进行提取,完成识别,自动查找可疑字,具有前后联想等功能。
81.文字编辑步骤,包括:
82.文字编辑步骤主要对ocr识别后的文字进行修改、编辑,如识别认为有误,则文字会以醒目的红色或蓝色显示,并提供相似的文字供选择,选择编辑器供输出等。
83.示例性地,指标数据、标签信息和非结构化数据在输入根据ocr构建的基础机器学习模型后,会把影像数据作一个转换,使影像数据内的图形继续保存、有表格则表格内资料及影像内的文字,一律变成计算机文字,使能达到影像数据的储存量减少、识别出的文字可再使用及分析,可节省因键盘输入的人力与时间。
84.从影像数据到结果输出,须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正,将结果输出。
85.nlp是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
86.nlp是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。
87.可选地,可以构建模型仓库,即根据不同的指标数据、标签信息和非结构化数据训练得到多个不同的风控模型,多个风控模型构成模型仓库,在需要风控模型时,可以根据模型仓库中进行选择。
88.进一步地,预先获得离线模型结果的步骤,包括:
89.获取历史财务数据;
90.将历史财务数据输入风控模型,得到离线模型结果。
91.在上述实现过程中,根据历史财务数据获得离线模型结果,可以增加异常分析过程中的参考性,使得异常分析更加稳定,提高分析结果的准确性。
92.进一步地,s3包括:
93.根据财务数据和离线模型结果配置比例参数、阈值和关键字;
94.根据比例参数、阈值和关键字获得风控参数。
95.在上述实现过程中,根据比例参数、阈值和关键字获得风控数据,使得风控数据中包含多种关键信息,提高风控参数的实用性,缩短获得分析结果的时间。
96.本技术实施例中,除多元化经营判断外,大部分场景可以做到90%以上请求程序审批,降低业务人力成本,缩短整体业务流程。
97.通过风控模型服务获得出各场景需要的标签,输出分析结果。分析结果包含通过、否决、人工。可选地,分析结果对应的概率可以根据银行和虚拟资源分析公司的需要进行调整。
98.实施例二
99.为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供一种财务数据的异常分析装置,如图2所示,该装置包括:
100.获取模块1,用于获取财务数据;
101.特征提取模块2,用于根据预先构建的风控模型对财务数据进行特征提取,得到财务数据特征;
102.参数配置模块3,用于根据财务数据和预先获得的离线模型结果进行参数配置,得到风控参数;
103.数据获得模块4,用于根据财务数据特征和风控参数获得财务数据对应的标签;
104.分析模块5,用于根据标签获得分析结果。
105.在上述实现过程中,通过对财务数据进行特征提取,并对财务数据和离线模型结果进行参数配置,得到标签,再根据标签获得分析结果,可以对虚拟资源分析过程中的财务数据进行分析,无需人工审核,缩短审核时间,减小出错概率,节省人力物力。
106.进一步地,该装置还包括构建模块,用于:
107.构建风控模型。
108.进一步地,构建模块还用于:
109.构建基础机器学习模型;
110.获取指标数据、标签信息和非结构化数据;
111.将指标数据、标签信息和非结构化数据输入基础机器学习模型进行训练,得到风控模型。
112.在上述实现过程中,指标数据、标签信息和非结构化数据可以表达出数据的内容和结构,使得指标数据、标签信息和非结构化数据的特征更加明显,有利于提高分析结果,并且利用指标数据、标签信息和非结构化数据进行训练,可以减少训练过程中的冗余。
113.进一步地,数据获得模块4还用于:
114.获取历史财务数据;
115.将历史财务数据输入风控模型,得到离线模型结果。
116.在上述实现过程中,根据历史财务数据获得离线模型结果,可以增加异常分析过程中的参考性,使得异常分析更加稳定,提高分析结果的准确性。
117.进一步地,参数配置模块3还用于:
118.根据财务数据和离线模型结果配置比例参数、阈值和关键字;
119.根据比例参数、阈值和关键字获得风控参数。
120.在上述实现过程中,根据比例参数、阈值和关键字获得风控数据,使得风控数据中包含多种关键信息,提高风控参数的实用性,缩短获得分析结果的时间。
121.上述的财务数据的异常分析装置可实施上述实施例一的方法。上述实施例一中的可选项也适用于本实施例,这里不再详述。
122.本技术实施例的其余内容可参照上述实施例一的内容,在本实施例中,不再进行赘述。
123.实施例三
124.本技术实施例提供一种电子设备,包括存储器及处理器,该存储器用于存储计算机程序,该处理器运行计算机程序以使电子设备执行实施例一的财务数据的异常分析方法。
125.可选地,上述电子设备可以是服务器。
126.请参见图3,图3为本技术实施例提供的电子设备的结构组成示意图。该电子设备可以包括处理器31、通信接口32、存储器33和至少一个通信总线34。其中,通信总线34用于实现这些组件直接的连接通信。其中,本技术实施例中设备的通信接口32用于与其他节点设备进行信令或数据的通信。处理器31可以是一种集成电路芯片,具有信号的处理能力。
127.上述的处理器31可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器31也可以是任何常规的处理器等。
128.存储器33可以是,但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read-only memory,prom),可擦除只读存储器(erasable programmable read-only memory,eprom),电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。存储器33中存储有计算机可读取指令,当计算机可读取指令由所述处理器31执行时,设备可以执行上述图1方法实施例涉及的各个步骤。
129.可选地,电子设备还可以包括存储控制器、输入输出单元。存储器33、存储控制器、处理器31、外设接口、输入输出单元各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通信总线34实现电性连接。处理器31用于执行存储器33中存储的可执行模块,例如设备包括的软件功能模块或计算机程序。
130.输入输出单元用于提供给用户创建任务以及为该任务创建启动可选时段或预设执行时间以实现用户与服务器的交互。输入输出单元可以是,但不限于,鼠标和键盘等。
131.可以理解,图3所示的结构仅为示意,电子设备还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组
合实现。
132.另外,本技术实施例还提供一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理器执行时实现实施例一的财务数据的异常分析方法。
133.本技术实施例还提供一种计算机程序产品,该计算机程序产品在计算机上运行时,使得计算机执行方法实施例所述的方法。
134.在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。
135.在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的装置来实现,或者可以用专用硬件与计算机指令的组合来实现。
136.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
137.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
138.以上所述仅为本技术的实施例而已,并不用于限制本技术的保护范围,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
139.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应所述以权利要求的保护范围为准。
140.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在
包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献