一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

担保信息获取方法、装置、存储介质及电子设备与流程

2022-04-02 03:13:32 来源:中国专利 TAG:


1.本公开涉及数据处理技术领域,尤其涉及一种担保信息获取方法、装置、存储介质及电子设备。


背景技术:

2.担保业务对于企业来说具有一定风险,一旦被担保方无力偿还到期债务,担保方就不得不承担连带责任而负责清偿债务。担保风险是评估一家企业整体风险的重要维度之一。
3.目前来说,担保信息的来源目前主要由上市公司披露,而中小企业的担保信息目前少有公开渠道获取。


技术实现要素:

4.鉴于以上现有技术的缺点,本公开的目的在于提出一种担保信息获取方法、装置、存储介质及电子设备,用于高效准确地挖掘不同企业的担保信息。
5.第一方面,本公开提供一种担保信息获取方法,包括:获取待处理的裁判文书;基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出所述裁判文书中的待处理文本;提取出所述待处理文本中所包括的实体;基于所述实体从所述待处理文本中提取出担保信息,所述担保信息至少包括担保方、被担保方和债权人。
6.可选的,所述基于案由约束规则提取出所述裁判文书中的待处理文本,包括:对所述裁判文书中的案由字段进行识别,以确定所述裁判文书的案由类目;至少提取出案由类目为借款合同类目的裁判文书,作为待处理文本。
7.可选的,述基于关键词约束规则提取出所述裁判文书中的待处理文本,包括:对所述裁判文书进行全文检索,若检索出涉及担保信息的指定关键词,则将所述裁判文书作为待处理文本。
8.可选的,所述涉及担保信息的指定关键词至少包括“担保”、“责任保证”、“连带责任”中的一个或多个。
9.可选的,所述基于段落约束规则提取出所述裁判文书中的待处理文本,包括:对所述裁判文书进行结构化处理,所述结构化处理后的裁判文书至少包括当事人信息文本块、原告诉称文本块、被告辩称文本块、审理经过文本块、本院查明文本块,以及审判结果文本块中的一个或多个文本块;对结构化处理后的裁判文书进行筛选处理,以保留其中的审理经过文本块、本院查明文本块和审判结果文本块作为待处理文本。
10.可选的,所述实体包括企业实体和/或个人实体,提取所述待处理文本中所包括的
实体,包括:采用实体识别模型,识别出所述待处理文本中提及的实体全称;获取第一类正则表达式,所述第一类正则表达式是根据实体全称和实体简称在所述待处理文本中的表述格式所确定的;在所述待处理文本中,基于所述第一类正则表达式进行正则匹配,以确定实体全称和实体简称的映射对。
11.可选的,述担保信息中还包括保证类型,在确定保证类型时执行以下步骤:当所述待处理文本的文本内容命中关键词“连带责任”时,将所述保证类型确定为连带责任保证;当所述待处理文本的文本内容未命中关键词“连带责任”时,将所述保证类型确定为一般责任保证。
12.可选的,所述基于所述实体从所述待处理文本中提取出担保信息,包括:获取第二类正则表达式,所述第二类正则表达式是根据担保方、被担保方以及债权人在所述待处理文本中的表述格式所确定的;在所述待处理文本中,基于所述第二类正则表达式和所述实体进行正则匹配,以确定与担保方相匹配的实体、与被担保方相匹配的实体以及与债权人相匹配的实体;将所述正则匹配中所得到的实体确定为担保信息中的对应的担保方、被担保方和债权人。
13.可选的,所述基于所述实体从所述待处理文本中提取出担保信息,包括:获取第三类正则表达式,所述第三类正则表达式是根据符合条件的金额信息在所述待处理文本中的表述格式所确定的;基于所述第三类正则表达式在所述待处理文本中进行正则匹配,以提取出符合条件的金额信息;将中文格式的所述金额信息和/或中文、数字混合格式的所述金额信息转为以元为单位的金额数值;从各个所述金额数值中提取出最大的一个金额数值,确定为担保信息中的被保证债权本金。
14.可选的,所述担保信息中共包括保证类型、担保方、被担保方、债权人以及被保证债权本金五个维度的数据,所述方法还包括:对所述担保信息进行过滤处理,并保留五个所述维度的数据均不为空的担保信息作为有效担保信息。
15.第二方面,基于本公开第一方面所述的担保信息获取方法,本公开的实施例还提供一种担保信息获取装置,包括:文书获取模块,用于获取待处理的裁判文书;文本确定模块,用于基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出所述裁判文书中的待处理文本;实体提取模块,用于提取出所述待处理文本中所包括的实体;担保信息确定模块,用于基于所述实体从所述待处理文本中提取出担保信息,所述担保信息至少包括担保方、被担保方和债权人。
16.可选的,所述文本确定模块,在基于案由约束规则提取出所述裁判文书中的待处理文本时,用于:对所述裁判文书中的案由字段进行识别,以确定所述裁判文书的案由类目;至少提取出案由类目为借款合同类目的裁判文书,作为待处理文本。
17.可选的,所述文本确定模块,在基于关键词约束规则提取出所述裁判文书中的待处理文本时,用于:对所述裁判文书进行全文检索,若检索出涉及担保信息的指定关键词,则将所述裁判文书作为待处理文本。
18.可选的,所述涉及担保信息的指定关键词至少包括“担保”、“责任保证”、“连带责任”中的一个或多个。
19.可选的,所述文本确定模块,在所述基于段落约束规则提取出所述裁判文书中的待处理文本时,用于:对所述裁判文书进行结构化处理,所述结构化处理后的裁判文书至少包括当事人信息文本块、原告诉称文本块、被告辩称文本块、审理经过文本块、本院查明文本块,以及审判结果文本块中的一个或多个文本块;对结构化处理后的裁判文书进行筛选处理,以保留其中的审理经过文本块、本院查明文本块和审判结果文本块作为待处理文本。
20.可选的,所述实体包括企业实体和/或个人实体,所述实体提取模块,在提取所述待处理文本中所包括的实体时,用于:采用实体识别模型,识别出所述待处理文本中提及的实体全称;获取第一类正则表达式,所述第一类正则表达式是根据实体全称和实体简称在所述待处理文本中的表述格式所确定的;在所述待处理文本中,基于所述第一类正则表达式进行正则匹配,以确定实体全称和实体简称的映射对。
21.可选的,所述担保信息中还包括保证类型,所述担保信息确定模块,在确定保证类型时,用于:当所述待处理文本的文本内容命中关键词“连带责任”时,将所述保证类型确定为连带责任保证;当所述待处理文本的文本内容未命中关键词“连带责任”时,将所述保证类型确定为一般责任保证。
22.可选的,所述担保信息确定模块,在基于所述实体从所述待处理文本中提取出担保信息时,用于:获取第二类正则表达式,所述第二类正则表达式是根据担保方、被担保方以及债权人在所述待处理文本中的表述格式所确定的;在所述待处理文本中,基于所述第二类正则表达式和所述实体进行正则匹配,以确定与担保方相匹配的实体、与被担保方相匹配的实体以及与债权人相匹配的实体;将所述正则匹配中所得到的实体确定为担保信息中的对应的担保方、被担保方和债权人。
23.可选的,所述担保信息确定模块,在基于所述实体从所述待处理文本中提取出担
保信息时,用于:获取第三类正则表达式,所述第三类正则表达式是根据符合条件的金额信息在所述待处理文本中的表述格式所确定的;基于所述第三类正则表达式在所述待处理文本中进行正则匹配,以提取出符合条件的金额信息;将中文格式的所述金额信息和/或中文、数字混合格式的所述金额信息转为以元为单位的金额数值;从各个所述金额数值中提取出最大的一个金额数值,确定为担保信息中的被保证债权本金。
24.可选的,所述担保信息中共包括保证类型、担保方、被担保方、债权人以及被保证债权本金五个维度的数据,所述装置还包括:过滤模块,用于对所述担保信息进行过滤处理,并保留五个所述维度的数据均不为空的担保信息作为有效担保信息。
25.第三方面,本公开实施例的还提供一种存储介质,所述存储介质上存储有计算机程序,所述处理器执行所述存储介质上存储的计算机程序时,实现如本公开第一方面所述的任意一种担保信息获取方法。
26.第四方面,本公开实施例还提供一种电子设备,所述电子设备包括存储器以及处理器,所述存储器上用于存储计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施本公开第一方面所述的任意一种担保信息获取方法。
27.本公开提供一种担保信息获取方法、装置、存储介质及电子设备,该担保信息获取方法包括获取待处理的裁判文书;基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出所述裁判文书中的待处理文本;提取出所述待处理文本中所包括的实体;基于所述实体从所述待处理文本中提取出担保信息,所述担保信息至少包括担保方、被担保方和债权人,本公开从裁判文书这一特定文本类型中进行担保风险信息的挖掘,依据其相关文本特征实现了结构化担保信息的抽取,弥补了中小企业担保信息无从获取,风险难以评估的问题。
附图说明
28.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
29.图1为本公开实施例提供的担保信息获取方法的一种工作流程图;图2为本公开实施例提供的担保信息获取方法的另一种工作流程图;图3为本公开实施例提供的担保信息获取方法的另一种工作流程图;图4为本公开实施例提供的担保信息获取方法的另一种工作流程图;图5为本公开实施例提供的担保信息获取方法的另一种工作流程图;图6为本公开实施例提供的担保信息获取方法的另一种工作流程图;图7为本公开实施例提供的一种担保信息获取装置的结构示意图;
图8为本公开实施例提供的一种用于进行担保信息获取的电子设备的硬件结构示意图。
具体实施方式
30.为了使本领域的人员更好地理解本公开实施例中的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本公开实施例一部分实施例,而不是全部的实施例。基于本公开实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本公开实施例保护的范围。
31.担保业务对于企业来说具有一定风险,一旦被担保方无力偿还到期债务,担保方就不得不承担连带责任而负责清偿债务。担保风险是评估一家企业整体风险的重要维度之一。
32.目前来说,担保信息的来源目前主要由上市公司披露,而中小企业的担保信息目前少有公开渠道获取。
33.本公开致力于解决上述问题,下面结合本公开实施例附图进一步说明本公开实施例具体实现。
34.实施例一、本公开实施例一提供一种担保信息获取方法,如图1所示,图1为本公开实施提供的一种担保信息获取方法的工作流程图,该担保信息获取方法包括步骤s101~步骤s104:步骤s101、获取待处理的裁判文书。
35.具体的,在本公开的一种实施例中,裁判文书是记载人民法院审理过程和结果,它是诉讼活动结果的载体,也是人民法院确定和分配当事人实体权利义务的唯一凭证。一份结构完整、要素齐全、逻辑严谨的裁判文书,既是当事人享有权利和负担义务的凭证,也是上级人民法院监督下级人民法院民事审判活动的重要依据。
36.常见的裁判文书有民事裁判文书,刑事裁判文书,行政裁判文书以及其他通用诉讼文书等。在实施例的一种实现方式中,通过将裁判文书这一类特定文本作为提取企业之间担保信息的依据,有效扩充了担保信息的来源。
37.与法律文书相关的现有技术请参见如下专利公开文件:cn110781299a、cn111784505a、cn110599289a和cn113011185a。
38.步骤s102、基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出所述裁判文书中的待处理文本;获取待处理的裁判文书后,还可以进一步对待处理裁判文书进行处理,将处理后得到的文本作为实际要进行担保信息挖掘的待处理文本。
39.由于法律诉讼数据量庞大,且经抽样统计发现包含担保信息的裁判文书在全量数据中占比较小,因此本实施例对裁判文书的文本进行约束,后续仅对约束范围内的裁判文书进行担保信息的抽取。
40.具体而言,可以基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出所述裁判文书中的待处理文本。下面分别对以上几种规则进行阐述。
41.øꢀ
案由约束规则:在基于案由约束规则提取出所述裁判文书中的待处理文本时,参见图2,可以包括
以下步骤:s201、对所述裁判文书中的案由字段进行识别,以确定所述裁判文书的案由类目;s202、至少提取出案由类目为借款合同类目的裁判文书,作为待处理文本。
42.裁判文书“案由”字段包含民间借贷纠纷、金融借款合同纠纷、买卖合同纠纷、租赁合同纠纷、机动车交通事故责任纠纷等多个取值。经过抽样统计后,发现包含担保信息的裁判文书主要集中在案由为借款合同、金融借款合同等类目中。因此,本实施例中用于提取担保风险信息的文本范围限制在上述案由类目之中,其他案由的裁判文书由于抽取结果存在一定干扰暂不列入抽取范围之内。
43.øꢀ
关键词约束规则:在基于关键词约束规则提取出所述裁判文书中的待处理文本时,可以对所述裁判文书进行全文检索,若检索出涉及担保信息的指定关键词,则将所述裁判文书作为待处理文本。
44.在一些实施例中,所述涉及担保信息的指定关键词至少包括“担保”、“责任保证”、“连带责任”中的一个或多个,指定关键词也可以包括其他关键词,本实施例对此不做限制。
45.在一些实施例中,在进行关键词检索时,仅检索裁判文书的正文部分,以确保处理的准确性。
46.øꢀ
段落约束规则:在基于段落约束规则提取出所述裁判文书中的待处理文本时,参见图3,可以执行以下步骤:s301、对所述裁判文书进行结构化处理,所述结构化处理后的裁判文书至少包括当事人信息文本块、原告诉称文本块、被告辩称文本块、审理经过文本块、本院查明文本块,以及审判结果文本块中的一个或多个文本块;s302、对结构化处理后的裁判文书进行筛选处理,以保留其中的审理经过文本块、本院查明文本块和审判结果文本块作为待处理文本。
47.段落约束是指对结构化之后的文书进行段落筛选。结构化的文书主要包含当事人信息、原告诉称、被告辩称、审理经过、本院查明、审判结果等字段,由于在原告辩称与被告诉称中的信息可能不完全真实,本实施例对抽取文本范围进行了限制,仅使用审理经过、本源查明和审判结果三个部分的文本信息对担保信息的相关字段进行抽取。
48.以上处理方式减少了挖掘担保信息过程所要处理的数据量,节省了系统的处理资源,提高了挖掘担保信息的效率。
49.在一种可选的实施例中,在获取到待处理的裁判文书后,可以顺序应用案由约束规则、关键词约束规则和段落约束规则进行处理,每一步处理时均应用上一步处理获得的结果。即先应用案由约束规则对待处理的裁判文书进行筛选,利用案由字段筛除掉大量不符合条件的裁判文书,再应用关键词约束规则对上一步得到的案由字段符合条件的裁判文书进行检索,得到确实涉及担保信息的裁判文书,最后对确定涉及担保信息的裁判文书应用段落约束规则,将裁判文书中的包括真实有效担保信息的文本提取出来,得到最终的待处理文本。由于每个步骤需要使用的处理资源不同,这样的处理顺序可以进一步节省处理资源。
50.步骤s103、从裁判文书中确定出至少两个当事人实体。
51.具体地,在本公开的一种实施例中,所述当事人实体包括企业实体和/或个人实体。
52.在本公开实施例的一种实现方式中,提取所述待处理文本中所包括的实体,参见图4,可以执行以下步骤:s401、采用实体识别模型,识别出所述待处理文本中提及的实体全称;s402、获取第一类正则表达式,所述第一类正则表达式是根据实体全称和实体简称在所述待处理文本中的表述格式所确定的;s403、在所述待处理文本中,基于所述第一类正则表达式进行正则匹配,以确定实体全称和实体简称的映射对。
53.首先,采用实体识别模型,识别企业全称和人名,获得正文中提及的所有人名和企业全称实体。在一些实施例中,实体识别模型为基于bert crf的开源模型,该实体识别模型可以预先通过裁判文书样本数据进行训练。
54.在得到实体全称后,再采用第一类正则表达式获取实体全称和实体简称的映射对。具体而言,裁判文书正文中常对企业全称进行简化。例如:待处理文本中包括文本:“再审申请人福州中x公司(以下简称中x公司)因与被申请人济南金x有限公司(以下简称金x公司)侵害著作权纠纷一案,不服山东高级人民法院(2020)鲁民终x号民事判决,向本院申请再审”。
55.依据该类文本特征可预先规定第一类正则表达式,例如使用形如“(以下简称(.*))”,
ꢀ“
(下称(.*))”、“(简称(.*))”的第一类正则表达式获取实体全称和实体简称的映射对。上述案例中的福州中x公司对应于简称“中x公司”,济南金x有限公司对应于简称“金x公司”。
56.步骤s104、基于所述实体从所述待处理文本中提取出担保信息,所述担保信息至少包括担保方、被担保方和债权人。
57.在一些实施例中,担保信息中共包括五个维度的数据,分别是:保证类型、担保方、被担保方、债权人和被保证债权本金。以下分别进行阐述。
58.øꢀ
保证类型:保证类型分为连带责任保证和一般责任保证,按照规定,当事人在保证合同中对保证方式没有约定或者约定不明确的,按照一般保证承担保证责任。本实施例也遵循以上规定,例如:当文本内容命中“连带责任” “保证”或“连带责任” “担保”关键词时,对应的保证类型为连带责任保证;其余仅命中“担保”关键词的文本对应的保证类型为一般责任保证。
59.øꢀ
担保方、被担保方和债权人:在本公开实施例的一种实现方式中,在基于所述实体从所述待处理文本中提取出担保信息时,参见图5,可以执行以下步骤:s501、获取第二类正则表达式,所述第二类正则表达式是根据担保方、被担保方以及债权人在所述待处理文本中的表述格式所确定的;s502、在所述待处理文本中,基于所述第二类正则表达式和所述实体进行正则匹配,以确定与担保方相匹配的实体、与被担保方相匹配的实体以及与债权人相匹配的实体;s503、将所述正则匹配中所得到的实体确定为担保信息中的对应的担保方、被担
保方和债权人。
60.具体而言,担保方、被担保方、债权人的提取存在一定依赖,可通过第二类正则表达式结合实体识别的结果进行提取。担保方、被担保方、债权人三个字段在裁判文书中通常以两种表述格式出现:一种表述格式是“a向b归还借款本金”,一种表述格式是“c对a承担连带偿清责任”。
61.在第一种表述格式中,a为债务人,且通常债务人和被担保人是同一实体,b为债权人。
62.在第二种表述格式中,c为担保人,a为被担保人。
63.根据以上两种表述格式可预先规定第二类正则表达式,在一些实施例中,第二类正则表达式中例如可以包括以下两个表达式。
64.(.*)(归还|支付|付还|给付|清还|偿还|返还|结欠|付给|清偿|清付|偿付)(.* )(本金|人民币|代偿款|垫付款)(.{0,40}元)"(.*)对.*
ꢀꢀ
[承担负].{0,4}(连带|共同).{0,6}责任|(.*)[承担负].{0,4}(连带|共同|保证).{0,6}责任基于第二类正则表达式,可以确定担保信息中的担保方、被担保方、债权人三个维度的数据。
[0065]
øꢀ
被保证债权本金:在本公开实施例的一种实现方式中,在基于所述实体从所述待处理文本中提取出担保信息时,参见图6,可以执行以下步骤:s601、获取第三类正则表达式,所述第三类正则表达式是根据符合条件的金额信息在所述待处理文本中的表述格式所确定的;s602、在所述待处理文本中,基于所述第三类正则表达式对所述实体进行正则匹配,以提取出符合条件的金额信息;s603、将中文格式的所述金额信息和/或中文、数字混合格式的所述金额信息转为以元为单位的金额数值;s604、从各个所述金额数值中提取出最大的一个金额数值,确定为担保信息中的被保证债权本金。
[0066]
根据被保证债权本金在裁判文书中的表述特征,可利用形如“借款.{0,20}元|本金.{0,20}元|贷款.{0,20}元”的第三类正则表达式对原文中的金额字段进行提取,提取后需要将中文文本或中文和数字混合的金额信息转为以元为单位的金额数值。由于裁判文书中存在借款本金,已偿还贷款金额,剩余贷款为偿还金额等多个金额信息,抽取时在符合抽取表达式的金额中,取数值最大的为借款本金,即被保证债权本金。
[0067]
需要注意的是,符合条件的金额信息不包括句子中包含“本息总额”,“贷款担保金额最高”两种情况,这两种情况并非借款本金的情况。
[0068]
提取担保信息中的保证类型,提取担保信息中的担保方、被担保方和债权人,提取担保信息中的被保证债权本金这三个提取步骤是相互独立的,其间没有顺序依赖。在一些实施例中,可以分别利用三个独立线程并行执行以上三类提取,以提高担保信息的获取效率。
[0069]
在一些实施例中,由于部分待处理文本表述格式特殊,未命中预定义的规则关键
词或正则表达式,致使部分维度的担保信息数据为空。
[0070]
在获取担保信息后,还需对所述担保信息进行过滤处理,并保留保证类型、担保方、被担保方、债权人以及被保证债权本金五个维度的数据均不为空的担保信息作为有效担保信息。
[0071]
本公开提供一种担保信息获取方法。先获取待处理的裁判文书;基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出所述裁判文书中的待处理文本;提取出所述待处理文本中所包括的实体;基于所述实体从所述待处理文本中提取出担保信息,所述担保信息至少包括担保方、被担保方和债权人。本公开通过裁判文书获取担保信息一方面可以扩充获取渠道,使获取到的担保信息更为全面,另一方面基于裁判文书的常有表述格式提取所需信息,实施成本较低,更为高效快捷。
[0072]
实施例二、第二方面,基于本公开第一方面所述的担保信息获取方法,本公开的实施例还提供一种担保信息获取装置,如图7所示,图7为本公开实施例提供的一种担保信息获取装置70的结构示意图,该担保信息获取装置70包括:文书获取模块701,用于获取待处理的裁判文书;文本确定模块702,用于基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出所述裁判文书中的待处理文本;实体提取模块703,用于提取出所述待处理文本中所包括的实体;担保信息确定模块704,用于基于所述实体从所述待处理文本中提取出担保信息,所述担保信息至少包括担保方、被担保方和债权人。
[0073]
可选的,所述文本确定模块,在基于案由约束规则提取出所述裁判文书中的待处理文本时,用于:对所述裁判文书中的案由字段进行识别,以确定所述裁判文书的案由类目;至少提取出案由类目为借款合同类目的裁判文书,作为待处理文本。
[0074]
可选的,所述文本确定模块,在基于关键词约束规则提取出所述裁判文书中的待处理文本时,用于:对所述裁判文书进行全文检索,若检索出涉及担保信息的指定关键词,则将所述裁判文书作为待处理文本。
[0075]
可选的,所述涉及担保信息的指定关键词至少包括“担保”、“责任保证”、“连带责任”中的一个或多个。
[0076]
可选的,所述文本确定模块,在所述基于段落约束规则提取出所述裁判文书中的待处理文本时,用于:对所述裁判文书进行结构化处理,所述结构化处理后的裁判文书至少包括当事人信息文本块、原告诉称文本块、被告辩称文本块、审理经过文本块、本院查明文本块,以及审判结果文本块中的一个或多个文本块;对结构化处理后的裁判文书进行筛选处理,以保留其中的审理经过文本块、本院查明文本块和审判结果文本块作为待处理文本。
[0077]
可选的,所述实体包括企业实体和/或个人实体,所述实体提取模块,在提取所述待处理文本中所包括的实体时,用于:
采用实体识别模型,识别出所述待处理文本中提及的实体全称;获取第一类正则表达式,所述第一类正则表达式是根据实体全称和实体简称在所述待处理文本中的表述格式所确定的;在所述待处理文本中,基于所述第一类正则表达式进行正则匹配,以确定实体全称和实体简称的映射对。
[0078]
可选的,所述担保信息中还包括保证类型,所述担保信息确定模块,在确定保证类型时,用于:当所述待处理文本的文本内容命中关键词“连带责任”时,将所述保证类型确定为连带责任保证;当所述待处理文本的文本内容未命中关键词“连带责任”时,将所述保证类型确定为一般责任保证。
[0079]
可选的,所述担保信息确定模块,在基于所述实体从所述待处理文本中提取出担保信息时,用于:获取第二类正则表达式,所述第二类正则表达式是根据担保方、被担保方以及债权人在所述待处理文本中的表述格式所确定的;在所述待处理文本中,基于所述第二类正则表达式和所述实体进行正则匹配,以确定与担保方相匹配的实体、与被担保方相匹配的实体以及与债权人相匹配的实体;将所述正则匹配中所得到的实体确定为担保信息中的对应的担保方、被担保方和债权人。
[0080]
可选的,所述担保信息确定模块,在基于所述实体从所述待处理文本中提取出担保信息时,用于:获取第三类正则表达式,所述第三类正则表达式是根据符合条件的金额信息在所述待处理文本中的表述格式所确定的;基于所述第三类正则表达式在所述待处理文本中进行正则匹配,以提取出符合条件的金额信息;将中文格式的所述金额信息和/或中文、数字混合格式的所述金额信息转为以元为单位的金额数值;从各个所述金额数值中提取出最大的一个金额数值,确定为担保信息中的被保证债权本金。
[0081]
可选的,所述担保信息中共包括保证类型、担保方、被担保方、债权人以及被保证债权本金五个维度的数据,所述装置还包括:过滤模块,用于对所述担保信息进行过滤处理,并保留五个所述维度的数据均不为空的担保信息作为有效担保信息。
[0082]
实施例三、第三方面,本公开实施例的还提供一种存储介质,所述存储介质上存储有计算机程序,所述处理器执行所述存储介质上存储的计算机程序时,实现如本公开第一方面所述的任一种担保信息获取方法,该担保信息获取方法包括但不限于:获取待处理的裁判文书;基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出
hardware description language)等,目前最普遍使用的是vhdl(very-high-speed integrated circuit hardware description language)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
[0087]
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc 625d、atmel at91sam、microchip pic18f26k20 以及silicone labs c8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
[0088]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0089]
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本公开时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
[0090]
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0091]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0092]
本领域技术人员应明白,本公开的实施例可提供为方法、系统或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0093]
本公开可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定事务或实现特定抽象数据类型的例程、程序、对象、组
件、数据结构等等。也可以在分布式计算环境中实践本公开,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行事务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0094]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0095]
以上所述仅为本公开的实施例而已,并不用于限制本公开。对于本领域技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本公开的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献