一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种合同审核的方法、装置、电子设备及存储介质与流程

2022-02-20 14:09:44 来源:中国专利 TAG:


1.本公开涉及计算机技术领域,具体而言,涉及一种合同审核的方法、装置、电子设备及存储介质。


背景技术:

2.随着互联网技术的飞速发展,在日常生产工作过程中,签订合同的方式越来越成为人们之间达成设立、变更、终止民事法律关系的主要方式。在签订合同的场景中,不可避免的需要对合同文本内容进行审核。
3.合同审核过程涉及到甲乙双方,在每一方都会有多个审核节点,用于审核不同条款。在传统合同审核方式中,更多的依赖于人工审核,也即,在各个审核节点进行相应条款的审核,特别是在需要对大量合同文本进行审核的情况下,审核效率较低。


技术实现要素:

4.本公开实施例至少提供一种合同审核的方法、装置、电子设备及存储介质,以提升审核效率。
5.第一方面,本公开实施例提供了一种合同审核的方法,所述方法包括:
6.获取待审核合同图像;
7.从所述待审核合同图像中,提取多个关键字段分别对应的合同要素数据,得到结构化合同信息;
8.根据预设的审核维度对所述结构化合同信息进行审核,得到所述待审核合同图像对应的合同审核结果。
9.采用上述合同审核的方法,可以从获取的待审核合同图像中提取多个关键字段分别对应的合同要素数据得到结构化合同信息,而后可以根据预设的审核维度对结构化合同信息进行审核,得到合同审核结果。相较于传统的人工审核方案而言,本公开可以基于提取的结构化合同信息自动的进行合同审核,且审核过程中可以从多个审核维度进行全面的审核,在保证审核质量的同时,提高审核效率。
10.在一种可能的实施方式中,所述从所述待审核合同图像中,提取多个关键字段分别对应的合同要素数据,得到结构化合同信息,包括:
11.对所述待审核合同图像进行文本内容识别,得到所述待审核合同图像对应的文本识别结果;
12.获取与所述待审核合同图像对应的结构化合同模板,并从所述文本识别结果中提取所述结构化合同模板中各个关键字段对应的合同要素数据;
13.基于提取的所述各个关键字段对应的合同要素数据,得到结构化合同信息。
14.这里,可以先进行文本内容识别,而后基于结构化合同模板从文本识别结果中提取合同要素数据以得到结构化合同信息,这样所得到的结构化合同信息更为符合合同的基本模板,提取操作简单高效。
15.在一种可能的实施方式中,在所述待审核合同图像对应的文本识别结果包括字符文本的情况下,在所述从所述文本识别结果中提取所述结构化合同模板中各个关键字段对应的合同要素数据之前,所述方法还包括:
16.基于训练的第一文本纠错网络对所述字符文本进行包括字音维度以及字形维度在内的多维度纠错,得到纠错后的字符文本;
17.其中,所述第一文本纠错网络为基于生成的错误语句样本训练得到,所述错误语句样本为基于预设的字音相似字符和字形相似字符对正确语句样本进行破坏得到的。
18.这里,可以进行字符文本的纠错处理,提升后续进行合同审核的准确性。
19.在一种可能的实施方式中,在所述待审核合同图像对应的文本识别结果包括数字文本的情况下,在所述从所述文本识别结果中提取所述结构化合同模板中各个关键字段对应的合同要素数据之前,所述方法还包括:
20.基于训练的第二文本纠错网络对所述数字文本进行文本纠错,得到纠错后的数字文本;
21.其中,所述第二文本纠错网络为基于包含有数字关系的语句样本训练得到。
22.这里,可以进行数字文本的纠错处理,提升后续进行合同审核的准确性。
23.在一种可能的实施方式中,所述审核维度包括以下审核维度中的至少一项:
24.关键要素维度、条款完备性维度、风险项维度、以及主体风险维度。
25.在一种可能的实施方式中,在所述审核维度包括所述关键要素维度的情况下,所述根据预设的审核维度对所述结构化合同信息进行审核,得到所述待审核合同图像对应的合同审核结果,包括:
26.针对所述多个关键字段中的每个关键字段,从所述结构化合同信息中查找是否存在与所述关键字段匹配的合同要素数据;
27.响应于存在与所述关键字段匹配的合同要素数据,对查找到的所述合同要素数据进行要素完整性审核,得到合同审核结果。
28.这里,可以先针对是否存在对应的合同要素数据进行审核,而后再对已存在的合同要素数据进行完整性审核,以实现要素完整性审核,提升审核的多样性。
29.在一种可能的实施方式中,所述关键字段包括条款项字段,所述合同要素数据包括与所述条款项字段对应的条款要素数据;在所述审核维度包括所述条款完备性维度的情况下,所述根据预设的审核维度对所述结构化合同信息进行审核,得到所述待审核合同图像对应的合同审核结果,包括:
30.确定属于每个合同签订人的条款字段以及与条款项字段对应的条款要素数据;
31.针对每个合同签订人,基于属于该合同签订人的各个条款项字段的条款要素数据以及对应条款项的权重之间的加权求和,确定该合同签订人的合同权益得分;
32.基于各个合同签订人的合同权益得分,确定所述合同审核结果。
33.这里,可以基于每个合同签订人的条款字段以及与条款项字段对应的条款要素数据确定对应的合同权益得分,进而验证各个合同签订人的权益是否一致,提升合同审核的多样性。
34.在一种可能的实施方式中,在所述审核维度包括所述风险项维度的情况下,所述根据预设的审核维度对所述结构化合同信息进行审核,得到所述待审核合同图像对应的合
同审核结果,包括:
35.判断所述结构化合同信息包括的合同要素数据中是否存在预设风险项条款,得到判断结果;
36.基于所述判断结果确定所述合同审核结果。
37.这里,可以针对风险项条款进行针对性的审核,以实现合同的安全性签订。
38.在一种可能的实施方式中,在所述审核维度包括所述主体风险维度的情况下,所述根据预设的审核维度对所述结构化合同信息进行审核,得到所述待审核合同图像对应的合同审核结果,包括:
39.从所述结构化合同信息包括的合同要素数据中提取主体元素;
40.基于预先构建的知识图谱,获取与所述主体元素关联的节点元素;
41.基于所述节点元素对应的节点信息对所述主体元素进行风险审核分析,得到所述合同审核结果。
42.这里,可以基于知识图谱实现主体风险审核,提升合同审核的多样性。
43.在一种可能的实施方式中,在所述获取待审核合同图像之后,所述方法还包括:
44.对所述待审核合同图像进行文本内容识别,得到所述待审核合同图像对应的文本识别结果;
45.基于训练的摘要提取网络对所述待审核合同图像对应的文本识别结果进行摘要提取,得到提取的合同摘要,并建立所述合同摘要与对应待审核合同的标识信息之间的绑定关系。
46.这里,可以基于摘要生成操作确定待审核合同图像对应的合同摘要,这样,在后续搜索或者执行其它合同操作的情况下,可以基于合同摘要快速的了解合同内容。
47.在一种可能的实施方式中,所述方法还包括:
48.响应于客户端针对待审核合同的搜索请求,从所述搜索请求中获取与所述待审核合同对应的标识信息;
49.基于所述标识信息将绑定的合同摘要返回至所述客户端。
50.在一种可能的实施方式中,所述待审核合同图像包括所属版本不同的多个合同图像,和/或,所属材质不同的多个合同图像;在所述获取待审核合同图像之后,所述方法还包括:
51.对所述多个合同图像分别进行文本内容识别,得到每个所述合同图像对应的文本识别结果;
52.基于每个所述合同图像对应的文本识别结果,确定所述多个合同图像中存在合同差异的待确认位置。
53.这里,可以实现不同版本和/或不同材质的多个合同之间的比对,以确认合同差异的位置,这为合同管理提供了依据。
54.第二方面,本公开实施例还提供了一种合同审核的装置,所述装置包括:
55.获取模块,用于获取待审核合同图像;
56.提取模块,用于从所述待审核合同图像中,提取多个关键字段分别对应的合同要素数据,得到结构化合同信息;
57.审核模块,用于根据预设的审核维度,对所述结构化合同信息进行审核,得到所述
待审核合同图像对应的合同审核结果。
58.第三方面,本公开实施例还提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如第一方面及其各种实施方式任一所述的合同审核的方法的步骤。
59.第四方面,本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如第一方面及其各种实施方式任一所述的合同审核的方法的步骤。
60.关于上述合同审核的装置、电子设备、及计算机可读存储介质的效果描述参见上述合同审核的方法的说明,这里不再赘述。
61.为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
62.为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
63.图1示出了本公开实施例所提供的一种合同审核的方法的流程图;
64.图2示出了本公开实施例所提供的一种合同审核的装置的示意图;
65.图3示出了本公开实施例所提供的一种电子设备的示意图。
具体实施方式
66.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
67.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
68.本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。
69.经研究发现,合同审核过程涉及到甲乙双方,在每一方都会有多个审核节点,用于审核不同条款。在传统合同审核方式中,更多的依赖于人工审核,也即,在各个审核节点进
行相应条款的审核,特别是在需要对大量合同文本进行审核的情况下,审核效率较低。
70.此外,不同审核人员的审核力度、审核侧重点可能会有所不同,目前没有一个体系化的审核方案能够使审核全员统一审核标准。
71.基于上述研究,本公开提供了一种合同审核的方法、装置、电子设备及存储介质,以提升审核效率的同时实现标准化审核。
72.为便于对本实施例进行理解,首先对本公开实施例所公开的一种合同审核的方法进行详细介绍,本公开实施例所提供的合同审核的方法的执行主体一般为具有一定计算能力的电子设备,该电子设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(user equipment,ue)、移动设备、蜂窝电话、无绳电话、个人数字助理(personal digital assistant,pda)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该合同审核的方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
73.参见图1所示,为本公开实施例提供的合同审核的方法的流程图,方法包括步骤s101~s103,其中:
74.s101:获取待审核合同图像;
75.s102:从待审核合同图像中,提取多个关键字段分别对应的合同要素数据,得到结构化合同信息;
76.s103:根据预设的审核维度,对结构化合同信息进行审核,得到待审核合同图像对应的合同审核结果。
77.为了便于理解本公开实施例提供的合同审核的方法,接下来对该方法的应用场景进行详细介绍。本公开实施例中的合同审核方法主要可以应用于合同审核领域中,且可以适应于各种类型的合同的审核,例如,可以是针对聘用合同、借调合同、停薪留职合同、技术转让合同、技术开发合同等合同的审核。
78.考虑到合同审核过程涉及到甲乙双方,在每一方都会有多个审核节点,比如,用于审核不同条款的多个审核节点。在传统合同审核方式中,更多的依赖于人工审核,但审核过程中的反复修改,会影响到合同审核的效率。
79.此外,不同审核人员的审核力度、审核侧重点可能会有所不同,目前没有一个体系化的审核规则能够使审核全员统一审核标准。
80.正是为了解决上述问题,本公开实施例才提供了一种基于结构化合同信息提取以实现自动化合同审核的方案,在确保审核标准化的前提下,提升了审核效率。
81.其中,这里的待审核合同图像可以是当前待审核的合同图像,例如,可以是对纸质版的技术开发合同进行拍摄所得到的图像,再如,可以是对电子版的技术转让合同进行拍摄所得到的图像。
82.针对待审核合同图像而言,本公开实施例可以先确定结构化合同信息,而后根据预设的审核维度对结构化合同信息进行审核,从而得到合同审核结果。
83.其中,有关结构化合同信息用于指示的合同中具有一定结构性的信息,该信息可以是与关键字段对应的合同要素数据,以甲方作为关键字段为例,aa公司则可以作为对应的合同要素数据;以条款1作为关键字段为例,aa公司具有bb义务中的bb义务则可以作为对应的合同要素数据。也即,关键字段可以指示的是合同相关的关键信息标志,合同要素数据
则可以指示的是具体的信息内容。
84.本公开实施例中,可以对结构化信息进行一个或多个审核维度的审核,这里的审核维度可以是包括关键要素维度、条款完备性维度、风险项维度、以及主体风险维度等维度。其中,关键要素维度和主体风险维度可以针对特定合同内容的审核,条款完备性维度以及风险项维度可以针对特定合同款项的审核。在实际应用中,有关采用的合同审核维度可以基于不同的用户需求来选取,这里不做具体的限制。
85.考虑到结构化合同信息的生成对于后续进行合同审核的关键作用,接下来可以对生成结构化合同信息的过程进行具体描述。
86.上述生成结构化合同信息的过程具体包括如下步骤:
87.步骤一、对待审核合同图像进行文本内容识别,得到待审核合同图像对应的文本识别结果;
88.步骤二、获取与待审核合同图像对应的结构化合同模板,并从文本识别结果中提取结构化合同模板中各个关键字段对应的合同要素数据;
89.步骤三、基于提取的各个关键字段对应的合同要素数据,得到结构化合同信息。
90.这里,可以进行文本内容识别以得到文本识别结果。与此同时,还可以获取与待审核合同图像对应的结构化合同模板。这样,即可以从文本识别结果中提取出结构化合同模板中各个关键字段对应的合同要素数据,进而确定结构化合同信息。
91.其中,有关文本识别结果的识别过程,可以理解成是从图像中提取出图像文本的过程。通过针对整个合同的文本识别操作,这里可以得到全局的合同文本内容。在具体应用中,可以采用光学字符识别(optical character recognition,ocr)技术提取文本识别结果,除此以外,还可以采用其它识别技术实现图像中文本的识别,本公开实施例对此不做具体的限制。
92.另外,本公开实施例中,可以基于相关的合同信息确定对应的结构化合同模板,比如,在合同标题中指示有框架协议、补充协议、采购合同、劳务合同等等字样的情况下,可以基于标题文字从合同模板库中选取对应的结构化合同模板;再如,针对不同类型的合同可以设置对应的结构化合同模板,也即,这里的合同模板可以是基于不同类型的合同调整的,可以有利于后续的合同要素数据的提取。
93.本公开实施例中,基于结构化合同模板可以提取出各个关键字段对应的合同要素数据,这主要是考虑到结构化合同模板中可以预先定义好合同的整体布局,以及针对整体布局所预设好的各个关键字段,进而可以快速提取出合同要素数据。例如,可以提取出甲方、乙方等关键字段需要的合同要素数据,还可以可包括合同框架本身的内容、也可包括具体的金额数量等信息。
94.这里,为了确保合同的审核质量,在实现合同要素数据提取之前还可以进行文本纠错。本公开实施例中的文本纠错可以是字符文本的纠错,还可以是数字文本的纠错。可以通过如下两个方面进行具体说明。
95.第一方面:本公开实施例可以基于训练的第一文本纠错网络对字符文本进行包括字音维度以及字形维度在内的多维度纠错,得到纠错后的字符文本。
96.其中,本公开实施例中的第一文本纠错网络训练的可以是错误语句样本与正确语句样本之间的转换关系,这里的错误语句样本可以是基于字音相似字符和字形相似字符对
正确语句样本进行破坏得到的,这样,在学习到上述转换关系的情况下,即可以对待纠错的字符文本进行纠错。
97.需要说明的是,由于这里的文本破坏是基于字音相似字符以及字形相似字符两个层面的破坏,进而可以对待纠错的字符文本实现字音维度和字形维度等至少两个维度的纠错,也即,不管待纠错的字符文本中是存在字音错误还是字形错误,本公开实施例均可以进行高效且准确的纠错。
98.这里仍以ocr识别领域为例。例如,在待纠错的字符文本内容为“眼睛蛇”的情况下,可知这里存在有字音错误,这里,可以就“睛”和“镜”之间的字音相似来实现纠错;再如,在待纠错的字符文本内容为“缺铁性盆血”的情况下,可知这里存在有字形错误,这里,可以就“盆”和“贫”之间的字形相似来实现纠错。
99.在训练第一文本纠错网络之前,需要预先获取正确语句样本以及错误语句样本,进而可以将错误语句样本和对应的正确语句样本分别作为待训练的第一文本纠错网络的输入项和输出比对项实现第一文本纠错网络的训练,其中,正确语句样本作为输出比对项,可以作为对应的错误语句样本的监督信息来监督网络训练。
100.在训练文本纠错网络的过程中,可以将错误语句样本输入到待训练的第一文本纠错网络,而后将网络输出得到的输出结果与这一错误语句样本对应的正确语句样本(训练标签)进行比对,若对比结果不一致,则可以调整文本纠错网络的网络参数值,并可以基于调整后的第一文本纠错网络进行下一轮训练,直至对比结果高度匹配的情况下,得到训练好的第一文本纠错网络。
101.第二方面:本公开实施例可以基于训练的第二文本纠错网络对数字文本进行文本纠错,得到纠错后的数字文本。
102.这里的数字纠错主要是为了适应于合同中经常出现的金额、数量等关键信息所实现的纠错。例如,在一件商品的单价为5元,总数量为40的情况下,总价应为200元,假若合同中对应这一金额为其它数值,利用这里的第二文本纠错网络可以实现数字纠错。
103.在训练第二文本纠错网络的过程中,训练的是各个数字之间的运算关系,这里的运算关系可以是基于语义识别得到的,通过语义识别出的内容进行数学关系的学习,进而可以实现数字纠错。
104.利用上述字符文本的纠错方案以及数字文本的纠错方案,本公开实施例可以有效识别合同文书中存在的纰漏并给出纠错建议和提示,如错别字、敏感信息等,从而可以提高文书表达准确度,避免低级错误、保障文书质量。
105.考虑到不同合同具有不同的审核需求,接下来将从各个审核维度对合同审核进行具体说明。
106.针对关键要素维度这一审核维度而言,可以按照如下步骤实现合同审核:
107.步骤一、针对多个关键字段中的每个关键字段,从结构化合同信息中查找是否存在与关键字段匹配的合同要素数据;
108.步骤二、响应于存在与关键字段匹配的合同要素数据,对查找到的合同要素数据进行要素完整性审核,得到合同审核结果。
109.这里,可以先从结构化合同信息中查找是否存在与每个关键字段匹配的合同要素数据,在具体应用中,可以按照关键字段在合同中出现的顺序依次进行查找。例如,在查找
是否存在与甲方这一关键字段匹配的合同要素数据之后,再查找是否存在与乙方这一关键字段匹配的合同要素数据。
110.在查找到针对一个关键字段的合同要素数据的情况下,可以对合同要素数据的完整性进行审核,例如,可以验证aa公司的名称是否齐全,还可以审核大小写金额是否附带有金额符号等。
111.针对条款完备性维度这一审核维度而言,可以按照如下步骤实现合同审核:
112.步骤一、确定属于每个合同签订人的条款字段以及与条款项字段对应的条款要素数据;
113.步骤二、针对每个合同签订人,基于属于该合同签订人的各个条款项字段的条款要素数据以及对应条款项的权重之间的加权求和,确定该合同签订人的合同权益得分;
114.步骤三、基于各个合同签订人的合同权益得分,确定合同审核结果。
115.这里,针对每个合同签订人可以确定对应条款项字段的条款要素数据,进而基于加权求和方式,确定对应的合同权益得分。通过合同权益得分的比较可以衡量签约各方的合同权益,例如可以权衡甲乙方的权利和义务是否对等。在分值相差不大的情况下,说明签约各方的权利义务基本对等,是一个相对公平的合同,在分值相差较大的情况下,说明签约各方的权利义务不对等,可以考虑是否需要重新进行协商。
116.针对风险项维度这一审核维度而言,可以按照如下步骤实现合同审核:
117.步骤一、判断结构化合同信息包括的合同要素数据中是否存在预设风险项条款,得到判断结果;
118.步骤二、基于判断结果确定合同审核结果。
119.这里,可以通过预设风险项条款进行合同审核。以技术服务合同为例,针对乙方可以设置相应的保密条款,如果缺少这一保密条款,则说明合同审核不通过,需要重新添加对应的保密条款。
120.针对主体风险维度这一审核维度而言,可以按照如下步骤实现合同审核:
121.步骤一、从结构化合同信息包括的合同要素数据中提取主体元素;
122.步骤二、基于预先构建的知识图谱,获取与主体元素关联的节点元素;
123.步骤三、基于节点元素对应的节点信息对主体元素进行风险审核分析,得到合同审核结果。
124.这里,可以先从合同要素数据中提取主体元素,该主体元素可以对应的是合同主体,例如,甲方、乙方对应的签订人,还可以是合同事务主体,例如,针对技术转让这一事务。
125.通过预先构建的知识图谱可以确定与主体元素关联的节点元素,例如,可以确定与主体人物1(对应合同1)关联的节点人物2(对应合同2),在根据节点人物2对应的节点信息中指示有与主体人物1之间的利益冲突的情况下,对于当前待审核合同而言存在一定的签署风险。
126.除此之外,应用知识图谱的推理能力还可以对合同风险点进行归纳、判断和计算,可识别事实倾向型风险点(例如交付地点约定不明、重要条款缺失)和数值计算型风险点(例如合同总价款不一致)等。
127.本公开实施例中,可以通过合同摘要的生成来进行合同管理,具体可以通过如下步骤:
128.步骤一、对待审核合同图像进行文本内容识别,得到待审核合同图像对应的文本识别结果;
129.步骤二、基于训练的摘要提取网络对待审核合同图像对应的文本识别结果进行摘要提取,得到提取的合同摘要,并建立合同摘要与对应待审核合同的标识信息之间的绑定关系。
130.这里,将提取出的待审核合同图像对应的文本识别结果输入到训练好的摘要提取网络可以提取出合同摘要。
131.有关文本内容识别的过程参见上述描述内容,在此不再赘述。
132.有关训练摘要提取网络的过程,可以是基于各个合同文本以及对应的合同摘要(例如对于合同文本概括出的一句话)训练得到的,也即,上述摘要提取网络训练的是合同文本与对应合同摘要的对应关系。
133.在提取出合同摘要的情况下,可以建立合同摘要与对应待审核合同的标识信息之间的绑定关系。这样,在客户端需要进行待审核合同的搜索时,可以发起搜索请求以获取与待审核合同标识所绑定的合同摘要,从而方便用户在搜索、查询、调阅合同时能够了解合同核心内容。
134.本公开实施例中,还可以通过合同比对实现合同审核,具体包括如下步骤:
135.步骤一、对多个合同图像分别进行文本内容识别,得到每个合同图像对应的文本识别结果;
136.步骤二、基于每个合同图像对应的文本识别结果,确定多个合同图像中存在合同差异的待确认位置。
137.在合同审核的具体应用中,通过文本识别结果之间的比对结果可以快速找出不同版本合同之间的修改区域以及版本差异。以两版合同为例,前一版和后一版都进行文本识别,得到两个文本识别结果,逐字比较可以确定存在合同差异的待确认位置。
138.在合同盖章归档场景下,可以有效识别实际签署纸质合同和电子版合同差异,可以避免纸质下的恶意修改所带来的合同风险等问题,确保合同签署的安全性。
139.本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
140.基于同一发明构思,本公开实施例中还提供了与合同审核的方法对应的合同审核的装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述合同审核的方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
141.参照图2所示,为本公开实施例提供的一种合同审核的装置的示意图,装置包括:获取模块201、提取模块202、审核模块203;其中,
142.获取模块201,用于获取待审核合同图像;
143.提取模块202,用于从待审核合同图像中,提取多个关键字段分别对应的合同要素数据,得到结构化合同信息;
144.审核模块203,用于根据预设的审核维度对结构化合同信息进行审核,得到待审核合同图像对应的合同审核结果。
145.采用上述合同审核的装置,可以从获取的待审核合同图像中提取多个关键字段分
别对应的合同要素数据得到结构化合同信息,而后可以根据预设的多个审核维度对结构化合同信息进行审核,得到合同审核结果。相较于传统的人工审核方案而言,本公开可以基于提取的结构化合同信息自动的进行合同审核,且审核过程中可以从多个审核维度进行全面的审核,在保证审核质量的同时,提高审核效率。
146.在一种可能的实施方式中,提取模块202,用于按照如下步骤从待审核合同图像中,提取多个关键字段分别对应的合同要素数据,得到结构化合同信息:
147.对待审核合同图像进行文本内容识别,得到待审核合同图像对应的文本识别结果;
148.获取与待审核合同图像对应的结构化合同模板,并从文本识别结果中提取结构化合同模板中各个关键字段对应的合同要素数据;
149.基于提取的各个关键字段对应的合同要素数据,得到结构化合同信息。
150.在一种可能的实施方式中,在待审核合同图像对应的文本识别结果包括字符文本的情况下,提取模块202,还用于:
151.在从文本识别结果中提取结构化合同模板中各个关键字段对应的合同要素数据之前,基于训练的第一文本纠错网络对字符文本进行包括字音维度以及字形维度在内的多维度纠错,得到纠错后的字符文本;
152.其中,第一文本纠错网络为基于生成的错误语句样本训练得到,错误语句样本为基于预设的字音相似字符和字形相似字符对正确语句样本进行破坏得到的。
153.在一种可能的实施方式中,在待审核合同图像对应的文本识别结果包括数字文本的情况下,提取模块202,还用于:
154.在从文本识别结果中提取结构化合同模板中各个关键字段对应的合同要素数据之前,基于训练的第二文本纠错网络对数字文本进行文本纠错,得到纠错后的数字文本;
155.其中,第二文本纠错网络为基于包含有数字关系的语句样本训练得到。
156.在一种可能的实施方式中,审核维度包括以下审核维度中的至少一项:
157.关键要素维度、条款完备性维度、风险项维度、以及主体风险维度。
158.在一种可能的实施方式中,在审核维度包括关键要素维度的情况下,审核模块203,用于按照如下步骤根据预设的审核维度对结构化合同信息进行审核,得到待审核合同图像对应的合同审核结果:
159.针对多个关键字段中的每个关键字段,从结构化合同信息中查找是否存在与关键字段匹配的合同要素数据;
160.响应于存在与关键字段匹配的合同要素数据,对查找到的合同要素数据进行要素完整性审核,得到合同审核结果。
161.在一种可能的实施方式中,关键字段包括条款项字段,合同要素数据包括与条款项字段对应的条款要素数据;在审核维度包括条款完备性维度的情况下,审核模块203,用于按照如下步骤根据预设的审核维度对结构化合同信息进行审核,得到待审核合同图像对应的合同审核结果:
162.确定属于每个合同签订人的条款字段以及与条款项字段对应的条款要素数据;
163.针对每个合同签订人,基于属于该合同签订人的各个条款项字段的条款要素数据以及对应条款项的权重之间的加权求和,确定该合同签订人的合同权益得分;
164.基于各个合同签订人的合同权益得分,确定合同审核结果。
165.在一种可能的实施方式中,在审核维度包括风险项维度的情况下,审核模块203,用于按照如下步骤根据预设的审核维度对结构化合同信息进行审核,得到待审核合同图像对应的合同审核结果:
166.判断结构化合同信息包括的合同要素数据中是否存在预设风险项条款,得到判断结果;
167.基于判断结果确定合同审核结果。
168.在一种可能的实施方式中,在审核维度包括主体风险维度的情况下,审核模块203,用于按照如下步骤根据预设的审核维度对结构化合同信息进行审核,得到待审核合同图像对应的合同审核结果:
169.从结构化合同信息包括的合同要素数据中提取主体元素;
170.基于预先构建的知识图谱,获取与主体元素关联的节点元素;
171.基于节点元素对应的节点信息对主体元素进行风险审核分析,得到合同审核结果。
172.在一种可能的实施方式中,上述装置还包括:
173.建立模块204,用于在获取待审核合同图像之后,对待审核合同图像进行文本内容识别,得到待审核合同图像对应的文本识别结果;基于训练的摘要提取网络对待审核合同图像对应的文本识别结果进行摘要提取,得到提取的合同摘要,并建立合同摘要与对应待审核合同的标识信息之间的绑定关系。
174.在一种可能的实施方式中,上述装置还包括:
175.搜索模块205,用于响应于客户端针对待审核合同的搜索请求,从搜索请求中获取与待审核合同对应的标识信息;基于标识信息将绑定的合同摘要返回至客户端。
176.在一种可能的实施方式中,待审核合同图像包括所属版本不同的多个合同图像,和/或,所属材质不同的多个合同图像;在获取待审核合同图像之后,上述装置还包括:
177.比对模块206,用于对多个合同图像分别进行文本内容识别,得到每个合同图像对应的文本识别结果;基于每个合同图像对应的文本识别结果,确定多个合同图像中存在合同差异的待确认位置。
178.关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
179.本公开实施例还提供了一种电子设备,如图3所示,为本公开实施例提供的电子设备结构示意图,包括:处理器301、存储器302、和总线303。存储器302存储有处理器301可执行的机器可读指令(比如,图2中的装置中获取模块201、提取模块202、审核模块203对应的执行指令等),当电子设备运行时,处理器301与存储器302之间通过总线303通信,机器可读指令被处理器301执行时执行如下处理:
180.获取待审核合同图像;
181.从待审核合同图像中,提取多个关键字段分别对应的合同要素数据,得到结构化合同信息;
182.根据预设的审核维度对结构化合同信息进行审核,得到待审核合同图像对应的合同审核结果。
183.本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的合同审核的方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
184.本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的合同审核的方法的步骤,具体可参见上述方法实施例,在此不再赘述。
185.其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(software development kit,sdk)等等。
186.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
187.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
188.另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
189.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
190.最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献